La mémoire de mathématiques

数学めも by Müde

平均(期待値)と分散

平均(期待値)

確率論の文脈で平均、というと、期待値のことを指します。期待値は、確率変数を確率値によって加重平均したもの、ということができます。確率変数の取りうる値の平均、ということですね。

期待値は E(X) と書きます。丸括弧じゃなくて、大カッコを使って、E[X]と書くことが多いのですが、はてなの数式モードでは書けなかったので、丸括弧を使うことにします(直せたら直します)。

加重平均なので、確率分布が離散型の場合は、E(X) = \displaystyle \sum^{\infty}_{i=1} x_iP(X=x_i) で求められ、連続型の場合は E(X) = \displaystyle \int xf(x) dx です。

前回までのエントリーの文字を使えば、確率分布が離散型の場合は、E(X) = \displaystyle \sum k P(X=k) ということですね。文字のモチベーション…。

分散

先に定義だけ書いておきます。

分散は V(X) と書き、V(X) = E( (X - E(X))^{2} ) で求めます。

X - E(X)の部分は、確率変数 X と平均 E(X) の差を取っています。つまり、平均からのズレですね。このズレは、正になる場合も負になる場合もあるので、全体を2乗することで正にします。そして、その2乗の値の期待値を計算し、それを分散と定義しています。

イメージとしては、確率変数が平均からズレまくっていれば、(X - E(X))^{2}の値も大きくなります。分散が大きければデータがものすごく散らばっていますし、分散が小さければデータがあまり散らばってない、と考えることが出来ます。

式を展開してみます。カッコの中の X - E(X)E(X) は、平均という定数なので、別の記号にしてもいいはずです。なので、とりあえず、\overline{X} と置いてみることにします(E(X) = \overline{X})。 また、定数の期待値を計算すると、結局定数となるので、E(\overline{X}) = \overline{X} です(証明もできますが、覚えてしまったほうが楽です)。

V(X)
 = E( (X - \overline{X})^{2} )
 = E(X^{2} - 2X\overline{X} + \overline{X}^{2})
 = E(X^{2}) - E(2X\overline{X}) + E(\overline{X}^{2})
 = E(X^{2}) - 2\overline{X}E(X) + \overline{X}^{2}

今、E(X) = \overline{X} なので、2\overline{X}E(X) = 2\overline{X}\cdot\overline{X} = 2\overline{X}^{2} となります。ゆえに、

上式  = E(X^{2}) - 2\overline{X}^{2} + \overline{X}^{2}
 = E(X^{2}) - \overline{X}^{2}
 = E(X^{2}) - (E(X))^{2}

となりました。


この辺りは、大学の確率論の授業の4月、5月くらいに触れるくらい、非常に基本的なことかもしれませんが、その基本が重要だと思っています…。