離散確率分布と例

概要
本講義では、離散確率分布を詳細に探究し、その定義を連続および離散標本空間から出発して説明します。最もよく知られている5つの離散確率分布、すなわち二項分布（ベルヌーイ分布）、ポアソン分布、幾何分布、負の二項分布、および超幾何分布を取り上げ、それぞれの現実的な応用例を示します。さらに、トランプゲームや商品の販売などの実践的状況におけるこれらの分布の利用を含む演習問題を提示し、学生が統計学におけるこれらの基本的なツールを応用的に理解できるようにします。

学習目標: 本講義を修了した学生は次のことができるようになります。

理解する: 離散確率分布の概念とその主要な特徴。
応用する: 二項分布、ポアソン分布、幾何分布、負の二項分布、および超幾何分布。

目次:

離散確率分布の概念
最もよく知られている5つの離散確率分布
二項分布（ベルヌーイ分布）
ポアソン分布
幾何分布
負の二項分布
超幾何分布
演習問題

我々が標本空間を学ぶとき、それらが離散型と連続型の2種類に分類できることを観察します。標本空間が連続型である場合、その性質に従う確率変数を定義することができ、そこから離散確率分布を構築することが可能です。確率変数についてはすでにこちらで確認しましたので、ここでは離散確率分布に焦点を当てます。

離散確率分布の概念

確率変数 $X$ が離散確率分布をもつとは、有限または可算無限の集合 $C\subset\mathbb{R}$ が存在し、 $P\left(X\in C\right)=1;$ が成り立つ場合をいいます。このとき、もし $x\in C$ に対して $p_X(x) = P(X=x),$ が成立するならば、 $A\subset\mathbb{R},$ に対して次が成り立ちます。

$\begin{array}{lr} (*) & P\left(X\in A\right) = \displaystyle \sum_{x\in A \cap C} p_X(x) \end{array}$

特に、

$\begin{array}{lr} (**) & \displaystyle \sum_{x\in C} p_X(x) = 1. \end{array}$

もし $A=]-\infty, t],$ として $P(X\in A)$ を計算すると、次が得られます。

$P(X\in A) = P(X\leq t) = F_X(t) = \displaystyle \sum_{x\leq t}p_X(x)$

この計算から、 $F_X$ は $x\in C$ において大きさ $p_X(x)$ の「階段状の跳び」を持つ関数であると結論できます。 $C$ から $[0,1]$ への写像である関数 $p_X$ を確率質量関数と呼びます。したがって、離散分布は有限または可算無限の集合 $C\subset \mathbb{R}$ と、各 $x\in C$ に対して定義され、式 (*) および (**) を満たす関数 $p_X(x)\geq 0$ によって与えられます。

最もよく知られている5つの離散確率分布

この節では、離散確率分布の研究を続けます。以下に、最もよく知られている5つの離散確率分布を取り上げ、それぞれがどのような問題解決に役立つかを例示します。

二項分布（ベルヌーイ分布）

二項分布、またはベルヌーイ分布は、確率変数として、各試行の成功または失敗の回数 $X$ を考えます。ここで、試行回数は $n$ 、各試行の成功確率は $p$ です。確率変数 $X$ が二項分布に従うとき、 $X\sim Bi(n,p),$ となり、次の式が成り立ちます。

$\displaystyle \large P(X=k)= {{n}\choose{k}} p^k(1-p)^{n-k}$

例:

6面サイコロを15回投げる。3の倍数が4回出る確率はどのくらいか。

解答: https://youtu.be/MPqcYAwJ4Ws?t=182

ポアソン分布

ポアソン過程は、空間的および時間的な2つのカテゴリーに分けられます。この区別はパラメータ $\lambda$ の分解から生じます。

時間的な場合: $\lambda=f\cdot T,$ ここで $f$ は頻度、 $T$ は時間の区間です。
空間的な場合: $\lambda=\rho \cdot V,$ ここで $\rho$ は密度、 $V$ は標本体積です。

いずれの場合も、パラメータ $\lambda$ が無次元であることを強調しておく必要があります。また、ポアソン過程は二項過程の極限の場合であるため、この過程に関連する確率変数もある「成功または失敗の回数」と結びついています。確率変数 $X$ がポアソン分布に従うとき、 $X\sim Po(\lambda),$ が成立し、次の式が成り立ちます。

$\large\displaystyle P(X=k)=\frac{\lambda^k}{k!}e^{-\lambda}$

例（時間的な場合）:

もしある道路を1分あたり5台の車が通過するならば、1分半で7台通過する確率はどのくらいか。

解答: https://youtu.be/MPqcYAwJ4Ws?t=570

例（空間的な場合）:

通常の成人男性は、平均して1マイクロリットルの血液あたり500万個の赤血球を持っています。血液1.2マイクロリットルを採取したとき、同じ赤血球数が得られる確率はどのくらいか。

解答: https://youtu.be/MPqcYAwJ4Ws?t=741

幾何分布

二項過程を想像してみましょう（例えばコインを繰り返し投げるような場合）。ある試行回数の後に得られる成功の数を問う代わりに、最初の成功を得るために必要な試行回数を問うならば、それは幾何分布に従う離散確率変数となります。確率変数 $X$ が幾何分布に従うとき、 $X\sim Ge(p),$ が成り立ち、次の式が与えられます。

$\displaystyle \large P(X=k)=p(1-p)^{k-1}$

例:

あなたと友人が1発の実弾を入れた6つの部屋を持つリボルバーでロシアンルーレットを行います。引き金を引いて弾が出なかった場合、そのたびにシリンダーを回してから相手に渡し、次のターンを行います。このルールに基づいて、死亡する確率は次のときどのくらいか。

最初の試行で？
2回目の試行で？

解答: https://youtu.be/MPqcYAwJ4Ws?t=1368

負の二項分布

幾何分布に類似するのが負の二項分布であり、より一般的な形となります。二項過程（例えばコインを連続的に投げる場合）を行い、成功回数を問うのではなく、m 回目の成功を得るまでに行う試行回数を問う場合、それは負の二項分布に従う離散確率変数となります。確率変数 $X$ が負の二項分布に従うとき、 $X\sim Bn(m,p),$ が成り立ち、次の式が与えられます。

$\displaystyle\large P(X=k)= {{k-1}\choose{m-1}} p^m(1-p)^{k-m}$

例:

12面サイコロを投げる。出目が1または12の場合を「クリティカル」とする。5回目の試行で3回目のクリティカルを得る確率はどのくらいか。

解答: https://youtu.be/MPqcYAwJ4Ws?t=1699

超幾何分布

袋を想像してみましょう。そこには $N$ 個の玉があり、そのうち $M$ 個が白、残りは黒です。この袋から $n$ 個の玉を（非復元で）取り出すとき、取り出された白玉の数は超幾何分布に従う離散確率変数に対応します。確率変数 $X$ が超幾何分布に従うとき、 $X\sim Hg(N,M,n),$ が成り立ち、次の式が与えられます。

$\displaystyle \large P(X=k)=\frac{{{M}\choose{k}} {{N-M}\choose{n-k}}}{{N}\choose{n}}$

例:

30人のクラスに12人の男性と18人の女性がいる。無作為に7人を選ぶとき、5人が男性である確率はどのくらいか。

解答: https://youtu.be/MPqcYAwJ4Ws?t=2051

演習問題

あるボードゲーム店が、交換可能な500枚のカードのロットから無作為にカードを販売しているとする。店主は常に合計で450枚のコモン（低価値）カードと50枚のレア（高価値）カードがあるように管理している。無作為に20枚を購入したとき、レアカードを3枚得る確率はどのくらいか。
次のカードをゲームで使用する：

相手のカードが4枚捨て札になる確率はどのくらいか。
ある店舗において、工場出荷時の不良品を販売してしまう確率は2%である。10番目に販売されたデバイスが、工場不良の3台目である確率はどのくらいか。