連続確率分布

要約
ここでは、連続確率分布の概念を詳細に検討し、最もよく知られている5つの分布、すなわち指数分布、一様矩形分布、正規分布（ガウス分布）、ワイブル分布、ガンマ分布の特徴と用途を強調する。それぞれの分布を定義する数式を提示し、放射性試料における粒子放出の評価や、境界を持つレール上の球の位置の計算といった応用や実際的な意味合いについて考察する。さらに、これらの分布が特定のパラメータの適用によってどのように修正され、適応され得るかについても詳述する。

学習目標:
この授業を終えた後、学生は次のことができるようになる。

理解する 連続確率分布とは何か。
応用する よく知られている連続確率分布：指数分布、一様矩形分布、正規分布（ガウス分布）、ワイブル分布、ガンマ分布。

内容目次:
連続確率分布とは何か
最もよく知られている5つの連続確率分布
指数分布
一様矩形分布
正規分布（ガウス分布）
ワイブル分布
ガンマ分布
演習

先に標本空間について確認した際、これらが離散的か連続的の二種類に分類できることを見た。また、離散確率分布がどのように構成されるかも確認した。ここでは連続確率分布を扱う。

連続確率分布とは何か

確率変数 $X$ が連続確率分布を持つとは、ある関数 $f_X : \mathbb{R} \longrightarrow \mathbb{R}^+,$ が存在し、それを $X$ の密度 と呼び、次が成立する場合をいう： $\forall A \subseteq \mathbb{R}$

$P(X\in A) = \displaystyle \int_A f_X(x)dx$

特に、 $A=]a,b]$ を取ると次のようになる。

$P(a\lt X \leq b) = \displaystyle \int_a^b f_X(x)dx$

さらに $a=-\infty$ の場合

$F_X(x) = P( X \leq x) = \displaystyle \int_{-\infty}^x f_X(t)dt$

また、確率分布の性質(c)から次が成り立つ。

$\displaystyle \int_{-\infty}^{+\infty} f_X(t)dt = 1$

この最後の式に対して微積分の基本定理を適用すると、連続分布の場合、 $F_X(x)$ は全ての $x$ において連続であり、その導関数は $f_X(x)$ である。ただし $f_X(x)$ が連続な点において成り立つ。 $F_X(x)$ の連続性および性質(d)（こちらを参照）から次が導かれる：

$P(x=X)=0$

したがって

$P(x\leq X)= P(x\lt X)$

任意の関数 $f$ が $f\geq 0$ を満たし、かつ $\displaystyle \int_{-\infty}^{+\infty}f(x)dx = 1$ を満たすとき、それは密度と呼ばれる。

最もよく知られている5つの連続確率分布

指数分布

指数分布関数 パラメータ $\alpha \gt 0$ を持つものは、次の形をした分布関数 $F$ である。

$F(t) = \left\{\begin{array}{lll} 1 - e^{-t/\alpha} & ; & t\geq 0 \\ \\ 0 & ; & t\lt 0 \end{array}\right.$

したがって、その密度関数は次の形となる。

$\displaystyle f(t) = \left\{\begin{array}{lll} \frac{1}{\alpha}e^{-t/\alpha} & ; & t\geq 0 \\ \\ 0 & ; & t\lt 0 \end{array}\right.$

確率変数がパラメータ $\alpha$ の指数分布に従うとき、 $X\sim Ex(\alpha)$ と書く。

ポアソン分布の文脈では、放射性試料が平均放出率 $c$ で粒子を放出する場合、最初の粒子を放出する時刻 $T$ はパラメータ $1/c$ の指数分布に従う。言い換えれば、 $T\sim Ex(1/c)$ であり、その結果次が成立する：

$P(T\geq t)= e^{-ct}$

一様矩形分布

一様矩形分布 区間 $[a,b]$ 上においては、次の密度関数で定義される。

$f(x) = \left\{\begin{array}{lll} \displaystyle\frac{1}{b-a} & ; & x\in[a,b] \\ \\ 0 & ; & E.O.C. \end{array}\right.$

区間 $[a,b]$ の端に境界を持つレールに小さな球を落とし、それが端で弾性的に跳ね返ると仮定する。このとき、摩擦の影響で停止した位置に対応する確率変数 $X$ は一様矩形分布に従い、 $X\sim Un(a,b)$ と表される。

正規分布（ガウス分布）

連続確率分布の中で、正規分布は実際に最も広く利用されるものの一つである。

標準正規分布

標準正規密度は次の関数で定義される

$\displaystyle \phi_{0,1}(x) = \frac{1}{\sqrt{2\pi}} e^{-x^2/2}$

定義から明らかなように $\phi\gt 0$ である。したがって、これが確率密度であることは、次を確認することで確かめられる。

$\displaystyle \int_{-\infty}^{+\infty}\phi_{0,1}(x)dx$

この最後の等式は、 $I^2$ の値を計算することで示される。ただし $I =\int_{-\infty}^{+\infty}\phi(x)dx=1$ である。実際、次のようになる：

$\begin{array}{rl} I^2 & = \displaystyle \int_{-\infty}^{+\infty}\frac{1}{\sqrt{2\pi}} e^{-x^2/2} dx \int_{-\infty}^{+\infty}\frac{1}{\sqrt{2\pi}} e^{-x^2/2}dx \\ \\ & = \displaystyle \int_{-\infty}^{+\infty}\frac{1}{\sqrt{2\pi}} e^{-x^2/2} dx \int_{-\infty}^{+\infty}\frac{1}{\sqrt{2\pi}} e^{-y^2/2} dy \\ \\ & = \displaystyle \frac{1}{{2\pi}} \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} e^{-\frac{x^2 + y^2}{2}} dxdy \\ \\ \end{array}$

ところが次のようになる：

$\displaystyle \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} e^{-\frac{x^2 + y^2}{2}} dxdy = \int_{0}^{2\pi} \int_{0}^{+\infty} e^{-r^2/2} rdr d\theta = 2\pi$

したがって $I^2 = 1$ であり、 $I=\int_{-\infty}^{+\infty}\phi_{0,1}(x)dx = 1$ となる。

標準正規密度から標準正規分布が定義される： $\Phi_{0,1}(x) = \int_{-\infty}^x\phi_{0,1}(t)dt$ 。確率変数 $X$ が標準正規分布に従うとき、 $X\sim N(0,1)$ と書く。分布 $\Phi_{0,1}(x)$ は明示的に計算することはできないが、近似値を迅速に得られる表が存在する。

パラメータ $\mu$ と $\sigma$ を持つ正規分布

標準正規分布の密度 $\phi_{0,1}$ から、パラメータ $\mu$ と $\sigma$ を持つ正規分布の密度を構築することができる。ここで $\mu\in\mathbb{R}$ および $\sigma\gt 0$ はそれぞれ平均と標準偏差である。これらのパラメータを持つ正規分布の密度は次のように書ける：

$\displaystyle\phi_{\mu,\sigma}(x) = \frac{1}{\sigma}\phi_{0,1}\left(\frac{x-\mu}{\sigma} \right)$

したがって、パラメータ $\mu$ と $\sigma$ を持つ正規分布 $\Phi_{\mu,\sigma}(x)$ は次の形となる：

$\displaystyle \Phi_{\mu,\sigma}(x) = \int_{-\infty}^x\frac{1}{\sigma}\phi_{0,1}\left(\frac{t-\mu}{\sigma} \right)dt = \frac{1}{\sqrt{2\pi\sigma}}\int_{-\infty}^x e^{-\frac{(t-\mu)^2}{2\sigma^2}}dt$

確率変数 $X$ がパラメータ $\mu, \sigma$ の正規分布に従うとき、 $X\sim N(\mu, \sigma)$ と書く。

ワイブル分布

ワイブル分布 パラメータ $\alpha,\beta \gt 0$ を持つ場合、その分布関数は次の形となる。

$F(t) = \left\{\begin{array}{llr} \left(1 - e^{-t/\alpha} \right)^\beta &;& t\geq 0 \\ \\ 0 &;& t\lt 0 \end{array}\right.$

確率変数 $X$ がパラメータ $\alpha, \beta$ のワイブル分布に従うとき、 $X\sim We(\alpha,\beta)$ と書く。ワイブル分布は指数分布の一般化であり、 $We(\alpha,1) = Ex(\alpha)$ となることに注意されたい。

ガンマ分布

ガンマ分布 パラメータ $\beta,\alpha$ を持つ場合、その密度関数は次の形となる。

$f(t) = \left\{\begin{array}{llr} \displaystyle \frac{1}{\alpha \Gamma(\beta)}\left(\frac{t}{\alpha} \right)^{\beta-1}e^{-t/\alpha} &;& t\geq 0 \\ \\ 0 &;& t\lt 0 \end{array}\right.$

ここで $\Gamma(s) = \displaystyle \int_0^{+\infty}u^{s-1}e^{-u}du$ は「ガンマ関数」として知られている。

ガンマ関数の最も注目すべき性質の一つは、自然数の階乗を実数（さらには複素数）に一般化できる点である。部分積分を用いることで $\Gamma(s+1) = s\Gamma(s)$ を確認するのは難しくない。さらに、 $\Gamma(1)=1$ であるため、次が成り立つ：

$\left(\forall n\in\mathbb{N}\right)\left(\Gamma(n) = (n-1)! \right)$

確率変数 $X$ がパラメータ $\beta, \alpha$ のガンマ分布に従うとき、 $X\sim Ga(\alpha,\beta)$ と書く。ガンマ分布は指数分布のもう一つの一般化であり、 $Ga(\alpha,1) = Ex(\alpha)$ となることに注意されたい。

頻度 $c$ を持つポアソン過程（例えば放射性崩壊）において、 $T$ を m 番目の事象が発生する時刻を表す確率変数とすると、 $t\geq 0$ および時間区間 $[0,t]$ における事象数 $N$ に対して $t\lt T \leftrightarrow N\lt m$ が成立する。そして $N\sim Po(ct)$ であることから、次のようになる：

$1-F_T(t) = P(T\gt t) = \displaystyle \sum_{k=0}^{m-1}Po(k; ct)=e^{-ct}\sum_{k=0}^{m-1}\frac{(ct)^k}{k!}$

したがって、これを微分すると密度関数は次のようになる：

$\displaystyle f(t) = ce^{-ct}\frac{(ct)^{m-1}}{(m-1)!}$

したがって $T\sim Ga(1/c, m)$ となる。

演習

$\displaystyle f(x) = \frac{c}{x^2+1}$ が確率密度となるような定数 $c$ を求め、対応する分布関数（コーシー分布）を計算せよ。
$Un(a.b),$ の密度関数から、その対応する分布関数を求めよ。
関数 $\Phi_{\mu,\sigma}(x)$ が確率分布関数であることを証明せよ。