二項分布の定義や期待値・分散、証明などまとめ

2020年6月8日

二項分布の定義

確率関数

2つのパラメータ\(p(0 \leq p \leq 1)\), \(n\)(\(n\)は自然数)に対して、$$P(k)= \binom{n}{k} p^{k} (1-p)^{n-k}$$

補足:\( \binom{n}{k} \)は二項係数のことで、\({}_n\text{C}_k=\frac {n!} {k!(n-k)!}\)と同じです。

定義

確率変数\(X\)の確率質量関数が、\(P(k)= \binom{n}{k} p^{k} (1-p)^{n-k}\)で与えられるとき、確率変数\(X\)は\( Bin(n,p) \)に従う。

パラメータ\((n,p)\)の二項分布を\( Bin(n,p) \)と表します。
また、確率変数\(X\)が\( Bin(n,p) \)に従うことを、\(X \sim Bin(n,p) \)と書きます。

二項分布の期待値・分散

期待値・分散

\(X \sim Bin(n,p)\)のとき
\(\qquad E[X]=np\)
\(\quad Var[X]=np(1-p)\)

証明

証明1

\begin{eqnarray*}
E[X] &=& \sum_{k=0}^n kP(X=k) \\
&=& \sum_{k=0}^n k \binom{n}{k} p^{k} (1-p)^{n-k} \\
&=& 0 + \sum_{k=1}^n k \binom{n}{k} p^{k} (1-p)^{n-k} \\
&=& \sum_{k=1}^n k \binom{n}{k} p^{k} (1-p)^{n-k} \\
&=& \sum_{k=1}^n n \binom{n-1}{k-1} p^{k} (1-p)^{n-k} \qquad (\because check1 ) \\
&=& np \sum_{k=1}^n \binom{n-1}{k-1} p^{k-1} (1-p)^{(n-1)-(k-1)} \\
&=& np \sum_{l=0}^{n-1} \binom{n-1}{l} p^{l} (1-p)^{(n-1)-l} \qquad (\because check2 ) \\
&=& np \{p + (1-p) \}^{n-1} \qquad (\because check3 ) \\
&=& np
\end{eqnarray*}[証明終わり]

*\(check1\)
\(k \geq 1\)のとき
\(\begin{eqnarray*}
k \binom{n}{k} &=& k \times \frac {n!} {k!(n-k)!} \\
&=& \frac {k n (n-1)!} {k (k-1)!(n-k)!} \\
&=& n \times \frac {(n-1)!} {(k-1)!(n-k)!} \\
&=& n \binom{n-1}{k-1}
\end{eqnarray*}\)

*\(check2\)
\( l=k-1 \)とおいた。

*\(check3\)
二項定理\((x+y)^n= \sum^{n}_{k=0} \binom{n}{k} x^{k} y^{n-k}\)を用れば、$$ \{p+(1-p)\}^{n-1} = \sum^{n-1}_{l=0} \binom{n-1}{l} p^{l} (1-p)^{(n-1)-l} $$が成り立つ。
また、\(\binom{n-1}{l} p^{l} (1-p)^{(n-1)-l}\)の部分は\( Bin(n-1,p) \)の確率質量関数であり、\(\sum_{l=0}^{n-1} \binom{n-1}{l} p^{l} (1-p)^{(n-1)-l}\)は全事象の確率であるため\(1\)として、直接\(np \sum_{l=0}^{n-1} \binom{n-1}{l} p^{l} (1-p)^{(n-1)-l}=np\)を導いてもよい。

証明2(確率母関数)

確率変数\(X\)の確率母関数\(G(s)\)は、二項定理より
\begin{eqnarray*}
G(s) &=& \sum ^{n}_{x=0}s^{x} ( \frac {n}{x} ) p^{x}(1-p) ^{n-x} \\
&=& \sum ^{n}_{x=0} ( \frac {n}{x} ) (ps)^{x}(1-p) ^{n-x} \\
&=& (ps+1-p)^n \\
&=& \{1+p(s-1)\}^n
\end{eqnarray*}で与えられる。ここから、\begin{eqnarray*}
G^{\prime}(1)&=&E[X]=np \qquad (\because check1 ) \\
G^{\prime\prime}(2)&=&E[X(X-1)]=n(n-1)p^2 \qquad (\because check2 )
\end{eqnarray*}が得られる。また分散は、
\begin{eqnarray*}
Var[X]&=&E[X^2]-(E[X])^2 \\
&=& E[X(X-1)]+E[X]-(E[X])^2 \\
&=& n(n-1)p^2+np-(np)^2 \\
&=& (np)^2 – np^2 + np – (np)^2 \\
&=& np – np^2 \\
&=& np(1-p)
\end{eqnarray*}[証明終わり]

*\(check1\)
合成関数の微分法\( \frac{dz}{dx} = \frac{dz}{dy} \frac{dy}{dx} \)を用いる。
\begin{eqnarray*}
\frac{dG(s)}{ds} &=& \frac{d(ps+1-p)^n}{d(ps+1-p)} \times \frac{d(ps+1-p)}{ds} \\
&=& np(ps+1-p)^{n-1}
\end{eqnarray*}よって、\(G^{\prime}(1)=np\)を得る。

*\(check2\)
\(G(s)\)を二階微分(\(check1\)で得た\(G^{\prime}(s)=np(ps+1-p)^{n-1}\)をもう一度微分)し、\(s=1\)を代入する。