Festina lente

急がば回れ(ラテン語)。時には寄り道も。

二項分布の期待値

自然科学の統計学という本の練習問題1.1ですね。*1

自然科学の統計学 (基礎統計学)

自然科学の統計学 (基礎統計学)

問題はタイトルの通り二項分布Bi(n,p)の平均値を求めよ、というものです。ここでnは試行の回数、p,qは成功/失敗する確率で背反なのでp+q=1です。


お達し*2には「定義に従って導け」とあります。

\displaystyle E(X)=\sum_i{}_nC_ip^iq^{n-i}\times i

ちょっとi\times p^iの辺りが(pを多項式と思ったときの)微分っぽいですね、ということで、天下り的ですが*3、二項定理を思い出します:*4

\displaystyle (a+b)^n=\sum_i{}_nC_ia^ib^{n-i}

両辺を変数aで偏微分すると、

\frac{\partial}{\partial a}(a+b)^n=n(a+b)^{n-1}

厳密に言えば、合成関数の微分を使っていますねー。一方で右辺は

\displaystyle \sum_i{}_nC_iia^{i-1}b^{n-i}

それぞれにaを掛けて繋ぎ合わせると

\displaystyle an(a+b)^{n-1}=\sum_i{}_nC_iia^ib^{n-i}

ここで、a=p,  b=qとおけば

\displaystyle E(X)=np(p+q)^{n-1}=np\times 1^{n-1}=np

2つめの等式ではp+q=1を使いましたー。

分散も同様に求められます。二項定理の式をもう1度aで偏微分すれば大丈夫です♪*5

*1:内緒ですが、この手のひたすら式変形でゴリ押しするやつは電車に乗りながら必死こいてノートで計算してましたw

*2:問題文

*3:「ア・プリオリに」とも言います

*4:本来は、p,qをそのまま微分してもいいんですが、p+q=1という制約があるお陰でpでの微分のときにqが従属変数っぽいので敢えて別の変数a,bを使いました

*5:ほぼ同等の式変形で求められますー