La mémoire de mathématiques

数学めも by Müde

確率分布のいろいろ、その3(正規分布、指数分布)

二項分布で、ずらずらと長く書いてしまった感じ…。とりあえず、正規分布と指数分布は、控えめに書いておこうと思います…。

連続型の確率分布

連続型の確率分布もいろいろあるのですが、離散型と少し違う部分があります。

まず、分布を示す関数を「確率密度関数」という名前で呼び、その関数を f(x) で示します。また、確率の値は一般的には区間で指定します。Wikipediaにもあるように…

P(a \lt X \lt b) = P(a \le X \lt b)
 = P(a \lt X \le b) = P(a \le X \le b) = \displaystyle \int_{a}^{b} f(x)\,dx

となります。

また、累積分布関数というものがあり、これは F(x) で表します。確率密度関数は小文字、累積分布関数は大文字ですね。

F(x) = P(X \lt x) = \displaystyle \int_{- \infty}^{x} f(t)\,dt

数式だけ見れば、ふーん、という感じですが、この累積分布関数を使えば、区間 a から b までの確率は、P(a \le X \lt b) = F(b) - F(a) と表せるということです。

ということで、どうしても教科書的な書き方になってしまいました…。

(正しくは、確率分布関数 P(x)微分可能であるとき、その P(x)導関数確率密度関数と呼ぶのですが、上の書き方だと説明の順番が逆ですね…。参考リンク → http://dsl4.eee.u-ryukyu.ac.jp/DOCS/error/node15.html )

正規分布

正規分布はざっくり言えば、平均が一番多くて、あとはなだらかに少なくなるような分布です。 具体例としてよく挙げられるのが、身長とか、テストの点数とかで、二項分布の n が十分大きい時の近似と説明されることもあります。

パラメータは平均\muと、分散\sigma^{2}で、確率密度関数f(x) = \displaystyle \frac{1}{\sqrt{2 \pi \sigma^{2}}} \exp \left( - \displaystyle \frac{(x - \mu)^{2}}{2 \sigma^{2}} \right) です。

指数分布

指数分布はポアソン分布を別の見方から見たようなものです。つまり、ポアソン分布は単位時間あたりに何回発生するかの確率であり、指数分布はどれくらい待てば事象が発生するかの確率です。

ポアソン分布同様、パラメータは単位時間あたりに発生する事象の数で、\lambda によって与えられます。確率密度関数f(x) = \lambda e^{- \lambda x} です。


なんか最後は、かなり適当になってしまいましたが、色々分布があるのだなあ…、というのをぼーっと覚えておけばいいのかなあと思います。

次のエントリーでは、平均と分散を見てみたいと思います。