幾何分布の定義と期待値・分散およびその証明

2020年6月9日

幾何分布の定義

確率関数

$$P(X=k)= p(1-p)^{k} \qquad (k=0,1,2,…)$$

(注意)
確率関数(確率質量関数)を\( P(X=k)= p(1-p)^{k-1} \, (k=1,2,3,…) \)とする場合もあります。

定義

確率変数\(X\)の確率質量関数が、\( P(X=k)= p(1-p)^{k} \quad (k=0,1,2,…) \)で与えられるとき、確率変数\(X\)は\( Ge(p) \)に従う。

ベルヌーイ試行を繰り返して、初めて成功させるまでにその試行が失敗した回数\(X\)の分布です。
1回の試行でその事象が起こることを成功、起こらないことを失敗と表現し、幾何分布は成功するまでに失敗した回数を確率変数\(X\)としたときの\(X\)の従う分布といえます。

パラメータ\(p\)の幾何分布を\( Ge(p) \)と表します。
また、確率変数\(X\)が\( Ge(p) \)に従うことを、\(X \sim Ge(p) \)と書きます。

幾何分布の期待値・分散

期待値・分散

\(X \sim Ge(p)\)のとき
\(\qquad E[X]= \frac{1}{p}\)
\(\quad Var[X]= \frac{1-p}{p^2}\)

(注意)
確率関数が\( P(X=k)= p(1-p)^{k-1} \, (k=0,1,2,…) \)で与えられた場合、期待値は\( \frac {1}{p} \)となります。(分散は同じです。)

証明

期待値の証明

$$ S_n = \sum_{k=0}^n k P(X=k) \ , \quad T_n = \sum_{k=0}^n k(k-1) P(X=k) $$とおくと、$$ E[X] = \lim_{n \to \infty} S_n \\
E[X(X-1)] = \lim_{n \to \infty} T_n $$が成り立つ。
ここで、\( q=1-p \)とおくと、\begin{eqnarray*}
S_n &=& \sum_{k=0}^n k P(X=k) \\
&=& \sum_{k=0}^n kp(1-p)^k \\
&=& \sum_{k=1}^n kpq^k \\
&=& pq + 2pq^2 + 3pq^3 + \cdots + npq^n
\end{eqnarray*}ここで、\begin{eqnarray*}
S_n -qS_n &=& (pq + 2pq^2 + 3pq^3 + \cdots + npq^n) – (pq^2 + 2pq^3 + 3pq^4 + \cdots + npq^{n+1}) \\
&=& pq + pq^2 + pq^3 + \cdots + pq^n – npq^{n+1} \\
&=& pq(1+ q + q^2 + \cdots +q^{n-1}) – npq^{n+1} \\
&=& \frac {pq(1-q^n)} {1-q} – npq^{n+1} \\
&=& q(1-q^n) – npq^{n+1}
\end{eqnarray*}したがって、\begin{eqnarray*}
S_n &=& \frac {q(1-q^n}{1-q} – \frac {npq^{n+1}}{1-q} \\
&=& \frac {q(1-q^n)}{p} – nq^{n+1}
\end{eqnarray*}ここで、$$\lim_{n \to \infty} nq^{n+1} = 0$$であるから、\begin{eqnarray*}
E[X] &=& \lim_{n \to \infty} S_n \\
&=& \lim_{n \to \infty} ({\frac {q(1-q^n)}{p} – nq^{n+1}}) \\
&=& \frac {q}{p} = \frac {1-p}{p}
\end{eqnarray*}[証明終わり]

\( \lim_{n \to \infty} nq^{n+1} = 0 \)は、\(q \leq 1\)より、指数関数と多項式関数の極限から導き出せます。

幾何分布の無記憶性

確率変数\(X\)が幾何分布\( Ge(p) \)に従うとき、いかなる成功確率\(p\)に対しても、$$P(X=k+n \mid X \geq n) = P(X=k)$$が成り立つ。

\(P(X=k+n \mid X \geq n)\)とは、失敗の回数が\(n\)回になった時点で、成功までの失敗回数が\(k+n\)回になる確率を表します。
つまり、\(P(X=k+n \mid X \geq n) = P(X=k)\)とは、過去の失敗回数によらず確率が決定することを表します。このような性質のことを無記憶性といいます。

簡単に言ってしまえば、「過去の結果からは何も分からない」ということになります。

証明

幾何分布の無記憶性の証明を見てみましょう。

\begin{eqnarray*}
P(X \geq n) &=& \sum^{\infty}_{i=n}{p(1-p)^i} \\
&=& p(1-p)^n \sum^{\infty}_{j=0}{(1-p)^j} \qquad(\because check1) \\
&=& p(1-p)^n \frac{1}{1-(1-p)} \qquad(\because check2) \\
&=&(1-p)^n \\
\end{eqnarray*}したがって、\begin{eqnarray*}
P(X=k+n \mid X \geq n) &=& \frac{P(X=k+n)}{P(X \geq n)} \\
&=& \frac{p(1-p)^{k+n}}{(1-p)^n} \\
&=& p(1-p)^k = P(X=k)
\end{eqnarray*}以上より\(P(X=k+n \mid X \geq n) = P(X=k)\)が成り立つ。[証明終わり]

\(*check1\)
\( i=n+j \)とした。

(*check2)
等比数列の和の公式\begin{eqnarray*}
\sum^{n}_{k=1}{ar^{k-1}} &=& \frac{a(1-r^n)}{1-r} \\
&=& \frac{a(r^n-1)}{r-1}
\end{eqnarray*}より、\( \lim_{l \to \infty} {(1-p)^l} = 0 \)に注意すると、\begin{eqnarray*}
\sum^{\infty}_{j=0}{(1-p)^j} &=& \frac{1-0}{1-(1-p)} \\
&=& \frac{1}{1-(1-p)} \\
&=& \frac{1}{p}
\end{eqnarray*}が成り立つ。