ポアソン分布の定義と期待値・分散まとめ

2020年3月28日

ポアソン分布の定義

確率関数

$$P(X=k)= \frac{\lambda^k}{k!} e^{- \lambda}$$

\( \lambda \)については以下ですぐに出てきます。

定義

確率変数\(X\)の確率質量関数が、\( P(X=k)= \frac{\lambda^k}{k!} e^{- \lambda} \)で与えられるとき、確率変数\(X\)は\( Po(\lambda) \)に従う。

ポアソン分布を\( Po(\lambda) \)と表します。
また、確率変数\(X\)が\( Po(\lambda) \)に従うことを、\(X \sim Po(\lambda) \)と書きます。

導出(小数法則)

ポアソン分布は、二項分布の\(n\)を大として\(p\)を小としたときの極限から得られます。
ただし、\(\lambda =np\)は一定です。(\(n\)が大きくなるほど\(p\)は小さくなる。)

二項分布の確率質量関数に\(p= \frac{\lambda}{n}\)を代入すると\begin{eqnarray*}
P(X=k) &=& \binom{n}{k} p^{k} (1-p)^{n-k} \\
&=& \frac{n(n-1) \cdots (n-k+1)}{k!} (\frac{\lambda}{n})^{k} (1- \frac{\lambda}{n})^{n-k} \\
&=& \frac{ \lambda^{k} n(n-1) \cdots (n-k+1)}{k! \cdot n^k} (1- \frac{\lambda}{n})^{n-k} \\
&=& \frac{\lambda^k}{k!} (\frac{n}{n}) (\frac{n-1}{n}) \cdots (\frac{n-(k-1)}{n}) (1- \frac{\lambda}{n})^{n} (1- \frac{\lambda}{n})^{-k} \quad ( \because check1) \\
&=& \frac{\lambda^k}{k!} (1- \frac{1}{n}) \cdots (1- \frac{k-1}{n}) (1- \frac{\lambda}{n})^{n} (1- \frac{\lambda}{n})^{-k} \\
&\rightarrow& \frac{\lambda^k}{k!} e^{-\lambda} \quad (n \rightarrow \infty) \qquad ( \because check2)
\end{eqnarray*}

*\(check1\)
\( n(n-1) \cdots (n-k+1) \)は因子が\(k\)個ですので、分母の\(n^k\)に対応させ、\( (\frac{n}{n}) (\frac{n-1}{n}) \cdots (\frac{n-(k-1)}{n}) \)とします。
また、\(x^{a-b}=x^a \times x^{-b}\)のように、\( (1- \frac{\lambda}{n})^{n-k} = (1- \frac{\lambda}{n})^{n} (1- \frac{\lambda}{n})^{-k} \)と分解します。

*\(check2\)
\(\frac{定数}{n}\)は\(n \rightarrow \infty\)のとき0になるので、\( (1- \frac{1}{n}) \cdots (1- \frac{k-1}{n}) \)はそれぞれの括弧の中が1となり、\(1 \times 1 \times \cdots \times 1 = 1^k =1\)となって消えます。
また、任意の\(x\)について\( (1+ \frac{x}{n})^n \rightarrow e^x \, (n \rightarrow \infty) \)となること(\(e^x\)の定義そのものです!)を用いると、\( (1- \frac{\lambda}{n})^{n} = (1+ \frac{ – \lambda}{n})^{n} \rightarrow e^{- \lambda}\)となります。
ここで、\( (1- \frac{\lambda}{n})^{-k} \)は\( (1+ \frac{x}{n})^n \)とは違い指数が発散しないので、\( (1- \frac{\lambda}{n})^{-k} \rightarrow 1\)となります。
したがって、矢印の後(極限)は$$ \frac{\lambda^k}{k!} 1^k \cdot e^{- \lambda} \cdot 1 = \frac{\lambda^k}{k!} e^{-\lambda} $$となることがわかります。

このような二項分布からポアソン分布への収束を「ポアソンの極限定理」や「ポアソンの小数法則」といいます。
二項分布について知りたい方はこちら↓

ポアソン分布の期待値・分散

期待値・分散

\(X \sim Po(\lambda) \)のとき
\(\qquad E[X]= \lambda \)
\(\quad Var[X]= \lambda \)

\(Po( \lambda )\)の期待値は\( \lambda \)なので、\( \lambda \)のことを「期待値パラメータ」ともいいます。

証明

証明1

期待値は、\begin{eqnarray*}
E[X] &=& \sum^{\infty}_{x=0} {x}\cdot \frac{\lambda^x}{x!} e^{- \lambda} \\
&=& \lambda \sum^{\infty}_{x=1} \frac{ \lambda^{x-1} }{(x-1)!} e^{- \lambda} \\
&=& \lambda \sum^{\infty}_{y=0} \frac{ \lambda^{y} }{y!} e^{- \lambda} \quad (\because check1) \\
&=& \lambda \quad (\because check2)
\end{eqnarray*}

*\(check1\)
\(y=x-1\)と置きました。

*\(check2\)
\(Po( \lambda )\)の全確率は1であることを用いました。

また、\begin{eqnarray*}
E[X(X-1)] &=& \sum^{\infty}_{x=0} {x(x-1)}\cdot \frac{\lambda^x}{x!} e^{- \lambda} \\
&=& \lambda^2 \sum^{\infty}_{x=2} \frac{ \lambda^{x-2} }{(x-2)!} e^{- \lambda} \\
&=& \lambda^2 \sum^{\infty}_{z=0} \frac{ \lambda^{z} }{z!} e^{- \lambda} \quad (\because check3) \\
&=& \lambda^2 \quad (\because check4)
\end{eqnarray*}より、分散は
\begin{eqnarray*}
Var[X] &=& E[X(X-1)] + E[X] – \{E[X]\}^2 \\
&=& \lambda^2 + \lambda – \lambda^2 \\
&=& \lambda
\end{eqnarray*}となる。

*\(check3\)
\(z=x-2\)と置きました。

*\(check4\)
\(Po( \lambda )\)の全確率は1であることを用いました。

証明2(確率母関数)

確率変数\(X\)の確率母関数\(G(s)\)は、
\begin{eqnarray*}
G(s) &=& E[s^X] \\
&=& \sum^{\infty}_{k=0} \frac{(s \lambda)^k}{k!} e^{- \lambda} \\
&=& e^{\lambda (s-1)}
\end{eqnarray*}となる。
(略)
よって、\begin{eqnarray*}
E[X]&=& \lambda \\
Var[X]&=& \lambda
\end{eqnarray*}

ポアソン分布の再生性

再生性

確率変数\(X, \, Y\)が独立で、それぞれ\(Po( \lambda_1 ), \, Po( \lambda_2)\)に従うとき、確率変数\(Z=X+Y\)は\(Po ( \lambda_1 + \lambda_2 ) \)に従う。

証明

\begin{eqnarray*}
P(Z=k) &=& \sum^{k}_{j=0} P(X=j) P(Y=k-j) \\
&=& \sum^{k}_{j=0} \frac{ \lambda_{1}^{j} }{j!} e^{- \lambda_1} \frac{ \lambda_{2}^{k-j} }{(k-j)!} e^{- \lambda_2} \\
&=& e^{- \lambda_1 – \lambda_2} \sum^{k}_{j=0} \frac{ \lambda_{1}^{j} \lambda_{2}^{k-j}}{j!(k-j)!} \\
&=& \frac{e^{- (\lambda_1 + \lambda_2)}}{k!} \sum^{k}_{j=0} \frac{k!}{j!(k-j)!} \lambda_{1}^{j} \lambda_{2}^{k-j} \\
&=& e^{-( \lambda_1 + \lambda_2)} \frac{( \lambda_1 + \lambda_2) ^{k}}{k!} (\because check1)
\end{eqnarray*}

*\(check1\)
二項定理\((x+y)^n= \sum^{n}_{k=0} \binom{n}{k} x^{k} y^{n-k}\)を用れば、$$ \sum^{k}_{j=0} \binom{j}{k} \lambda_{1}^{j} \lambda_{2}^{k-j} = \sum^{k}_{j=0} \frac{k!}{j!(k-j)!} \lambda_{1}^{j} \lambda_{2}^{k-j} = ( \lambda_1 + \lambda_2) ^{k} $$が成り立つことがわかります。
補足:\( \binom{n}{k} \)は二項係数のことで、\({}_n\text{C}_k=\frac {n!} {k!(n-k)!}\)と同じです。