確率統計の復習: 二項分布およびその期待値と分散

まったり確率統計の復習中。 今日は二項分布を学び直す。

反復試行の確率

1回の試行で事象 { A } が起こる確率を { p }、起こらない確率を  { 1 - p} とする。

この試行を  { n } 回行い、 {A} がちょうど  {x} 回起こる確率  {P_{x}}は、以下のように求めることができる。

 
{P_{x} = {}_{n}\mathrm{C}_{x} p^{x} \! \cdot \! (1-p)^{n-x} 
}

なお、高校数学(数学II)の範囲だが、{ {}_{n}\mathrm{C}_{x} }組み合わせの数と呼ばれており、 {n} 個の異なるものの中から重複を許さずに {x} 個を選ぶパターンの総数であり、以下のように定義される。

 {
{}_{n} \mathrm{C}_{x} = \dfrac{n!}{x! \! \cdot \! (n-x)! }
}

ちなみに、(0を含まない)自然数{n}かいじょう {n!} { n! = n \! \cdot \! (n-1) \! \cdot (n-2) \cdots 2 \! \cdot \! 1} で求める。 ついでに  {0! = 1} である。

二項分布

確率変数 {X = x\, (0, \, 1, \, \cdots \, n)} 、確率 {P_{x} = {}_{n}\mathrm{C}_{x} p^{x} \! \cdot \! (1-p)^{n-x} } に従う確率分布を二項分布と呼び、 { B(n,\, p)} で表す。

二項定理

非負の整数  {n} が与えられたとき、  { (a + b)^{n} = \displaystyle\sum_{i = 0}^{n} {}_{n}\mathrm{C}_{i}a^{n-i}b^{i} } を満たす。 これを二項定理という(この定理は数学的帰納法を用いて証明可能である)。

二項定理を用いると、二項分布  { B(n,\, p)} における確率の総和は以下のように計算できる。

 {
\begin{align}
& {}_{n} \mathrm{C}_{0} p^{n} + {}_{n} \mathrm{C}_{1} p^{n-1}(1-p) + \cdots \\
& \quad + {}_{n} \mathrm{C}_{n-1} p(1-p)^{n-1} + {}_{n} \mathrm{C}_{n} (1-p)^{n} \\
=& \displaystyle\sum_{i=0}^{n} {}_{n}\mathrm{C}_{i} p^{n-i} (1-p)^{i} \\
=& \left\{ p + (1-p) \right\}^{n} \\
=& 1^{n} \\
=& 1
\end{align}
}

モーメント母関数による二項分布の期待値と分散

モーメント母関数については、前回の日記を参照。

tercel-s.hatenablog.jp

二項分布のモーメント母関数  {M (\theta )} を以下に示す。

 {
\begin{align}
M (\theta) &= E [ e^{\theta X} ] \\
&= \displaystyle \sum_{x = 0}^{n} e^{\theta X} P_{x} \\
&= \displaystyle \sum_{x = 0}^{n} e^{\theta X} p^{x} (1-p)^{n - x} \\
&= \displaystyle \sum_{x = 0}^{n} {}_{n} \mathrm{C}_{x} (pe^{\theta})^{x} (1-p)^{n-x} \\
&= \left\{ pe^{\theta} + (1-p) \right\}^{n}
\end{align}
}

 {M (\theta )}  {\theta}微分し、 {M' ( \theta ) } を得る。

 {
\begin{align}
M' ( \theta ) &= n \left\{ pe^{\theta} + (1-p) \right\}^{n-1} \! \cdot \! \left\{ pe^{\theta} + (1-p) \right\}' \\
&= npe^{\theta} \left\{ pe^{\theta} + (1-p) \right\}^{n-1} 
\end{align}
}

この式変形には、合成関数の微分を用いている。

tercel-s.hatenablog.jp

さらに、  {M (\theta )} を 2 階微分し、 M'' (\theta) を得る。

 {
\begin{align}
M'' ( \theta ) =& np \left[ (e^{\theta})' \left\{ pe^{\theta} + (1-p) \right\}^{n-1} + \right. \\ 
& \quad \left. e^{\theta} \left\{ (pe^{\theta} + (1-p)^{n-1} ) \right\}' \right] \\
=& npe^{\theta} \left[ \left\{ pe^{\theta} + (1-p)\right\}^{n-1} + \right. \\
& \quad (n-1)pe^{\theta} \left\{ pe^{\theta} + (1-p)^{n-2} \right]
\end{align} \\
}

さらに、 {\theta} {0} を代入して、

 {
\begin{align}
\require{cancel}
M' ( 0 ) =& np\cancel{e^{0}} \left\{ p\cancel{e^{0}} + (1-p) \right\}^{n-1} \\
=& np \{ \underbrace{ p + (1-p) }_{1} \}^{n-1} \\
=& np \\
M'' ( 0) =& np \cancel{e^{0}} \left[ \left\{ p \cancel{e^{0}} + (1-p) \right\}^{n-1} + \right. \\
&= \left.  (n-1)p \cancel{e^{0}} \left\{ p \cancel{e^0} + (1-p)\right\}^{n-2} \right] \\
&= np \left\{ 1 + (n-1)p \right\}
\end{align} 
}

よって、二項分布  { B(n,\, p)} の期待値  { E [ X ] } および 分散  {V [ X ] } は、以下のように計算できる。

 {
\require{cancel}
\begin{align}
E [ X ] =& M'(0) \\
=& np \\
V [ X ] =& M''(0) - M'(0)^{2} \\
=& np \left\{ 1 + (n-1)p \right\} - (np)^{2} \\
=& np + n(n - 1)p^{2} - n^{2}p^{2} \\
=& np + \cancel{n^2p^2} - np^2 - \cancel{n^{2}p^{2}} \\
=& np(1-p)
\end{align}
}

よって、 { B(n,\, p)} における  { E [ X ] = np} {V [ X ] = np(1-p) } が得られた。