Festina lente

急がば回れ(ラテン語)。時には寄り道も。

二項分布の分散

前回に引き続きの、二項分布の分散(variance)です。*1例によって下記の本の練習問題ですね。

自然科学の統計学 (基礎統計学)

自然科学の統計学 (基礎統計学)

まずは分散の定義では、

V(X)=E(X^2)-E(X)^2

ですね。*2前回、平均はnpと求めましたので、右辺の第1項E(X^2)に集中しましょう。

\displaystyle E(X^2)=\sum_i{}_nC_ip^iq^{n-i}\times i^2

ですから前回同様、i^2p^iに注目しましょう。i^2と2乗が出てきているので2回微分してみましょうか。前回得た式

\displaystyle an(a+b)^{n-1}=\sum_i{}_nC_iia^ib^{n-i}

の両辺をaで偏微分します。左辺は

\displaystyle 
\begin{eqnarray}
\frac{\partial}{\partial a}\{ an(a+b)^{n-1} \}
&=& n(a+b)^{n-1}+an(n-1)(a+b)^{n-2} \\
&=& n(a+b)^{n-2}\{ (a+b)+a(n-1) \}
\end{eqnarray}

一方の右辺は

\displaystyle \sum_i{}_nC_ii^2a^{i-1}b^{n-i}

なので、両辺にaを掛ければ

\displaystyle n(a+b)^{n-2}\{ (a+b)+a(n-1) \} = \sum_i{}_nC_ii^2a^{i-1}b^{n-i}

よって、a=p, b=qとおけば

E(X^2)=pn(p+q)^{n-2}\{ (p+q)+p(n-1) \} =pn(1+pn-p)

前回同様、p+q=1を使ってますよー。まとめると、

V(X)=pn(1+pn-p)-(pn)^2=pn(1-p)=npq

*1:前回は、「平均」でした

*2:まぁ、何が定義かってのは、流儀によっても違うようですので、今回は計算し易いものを「定義」とする方針で