La mémoire de mathématiques

数学めも by Müde

確率分布のいろいろ、その2(ポアソン分布)

まずは、前々回のエントリーについて、2点補足です。

1点目は、「離散型の確率分布」という見出しについてです。こんなこと書かなくても良いと思いますが、離散型の確率分布というのは、確率変数に離散値を持つもの、離散変数を持つものの分布という意味です。連続変数であれば、連続型の確率分布、ということになりますね。

2点目は、これも書かなくて良いことかもしれませんが、二項分布についてです。二項分布の例でコインを10枚投げる場合について少し触れましたが、コインを10枚投げることが1つの試行であって、そのうち表が5枚出たとか、3枚出たというのが事象となります。試行と事象という言葉がありますが、試行がそのまま試すこと、事象は試した結果ということですね。

さて、続きです。

離散型の確率分布(つづき)

ポアソン分布

ポアソン分布は、二項分布と似ていて、ある結果が何回起きるのか、その確率を表したものです。二項分布では、2つのパラメータ、すなわち、起こる確率 p と、独立な試行の数 n がありました。ポアソン分布では、パラメータが1つしかなく、単位時間あたりに起こる回数 \lambda のみを与えます。

確率変数 Xk である確率は、P(X=k) = \displaystyle \frac{\lambda^{k}e^{-\lambda}}{k!} です。この式は、単位時間あたりに平均 \lambda 回何か発生することが分かっている時、その何かが単位時間あたりに k 回発生する確率がいくらかを表しています。単位は回なので、k は整数となります。

ポアソン分布は、二項分布の n\infty に飛ばしたものです。また、二項分布のもう一つのパラメータである p について、p = \displaystyle \frac{\lambda}{n} と考えます。この \lambda というのが、ポアソン分布のパラメータということになります。

p = \displaystyle \frac{\lambda}{n} は、つまり、\lambda = np です。今 \lambda は、単位時間あたりに発生する「何か」の数だと言いました。つまり定数です。ここに、n が極めて大きく、p が極めて小さいとき、\lambda は一定の値に保たれるという、ちょっと良くわからない仮定をそこに置きます。

ということを踏まえて、二項分布からポアソン分布を導出できるのですが、導出する式は既にネット上に色々あって、それを参考にして自分も手で計算したりしてみたものの、やはり参考にしたページにある式と同じようになってしまったので、導出方法をまとめているページのリンクをご紹介いたします。

上記PDFには、ポアソン分布の使いどころというのが書かれています。それを引用します。

(i) Poisson 分布は発生確率 p が小さくて例数 n が大きいときに使われる。

(ii) Poisson 分布の方が計算が楽なので、可能なら Poisson 分布を使いたい。

私も使いどころを考えたものの、やはり上に書かれている通りです…。ただ、(i)は二項分布からポアソン分布を導出するための仮定なので、非常に重要です。と、結局最後は、他者様のPDFの紹介に終始してしまいました。

とはいえ、二項分布からポアソン分布が導出される、ということは重要なポイントです。後日取り上げると思いますが、確率分布は他にも様々あるものの、ある分布のパラメータを無限に飛ばしたり、特殊条件をつけたり、逆に一般化することで、新しい分布が作られ、元の分布と新しい分布は相互に関係を持っています。二項分布からポアソン分布が導出できたのですが、ポアソン分布と同様に n を無限に飛ばすことで、正規分布を導出することも可能です。

次回は、正規分布を少し触れてみたいと思います。