ベイズの定理と複合確率
概要
本講義では、確率における二つの基本的な概念 ― 条件付き確率と複合確率 ― を扱った。特に P(A|B) と P(B|A) の違いが強調された。複合確率の定理は、事象 A の確率が、条件付き確率 P(A|B_i) と事象 B_i の確率との積の総和として表されることを示している。その後、ベイズの定理が提示され、条件付き確率 P(A|B_k)、確率 P(B_k)、および条件付き確率 P(A|B_i) と事象 B_i の確率の積の総和を用いて、条件付き確率 P(B_k|A) を計算できることが示された。これらの概念は条件付き確率を様々な文脈で理解し応用するために不可欠であり、ベイズの定理は新たな情報に基づいて確率を更新する強力な手段を提供する。
学習目標:
この講義を終えると、学生は以下のことができるようになる:
- 理解する ― 条件付き確率の概念を理解し、P(A|B) と P(B|A) の違いを区別する。
- 計算する ― 複合確率を用いて事象の確率を求める。
- 証明する ― ベイズの定理を示す。
前の 講義 では、条件付き確率の概念を確認し、また P(A|B) と P(B|A) を混同してはならないことを明確にした。日常言語において条件性は混乱を招くことがあるが、数学的には二つは全く異なるものであり、それでも相互に関連している。この関係は、複合確率の概念に基づいて定式化されたベイズの定理によって記述される。
複合確率と条件付き確率
定理: もし A が事象であり、B_1, B_2, \cdots, B_n が互いに排反な事象の集合であり、\displaystyle \bigcup_{i=1}^n B_i = \Omega, が成り立つならば、次が成立する:
\boxed{P(A) = \displaystyle \sum_{i=1}^n P(A|B_i) P(B_i)}
このようにして表される A の確率 をA の複合確率と呼ぶ。
証明:
| (1) | A は事象である | ; 前提 |
| (2) | \displaystyle \bigcup_{i=1}^n B_i = \Omega | ; 前提 |
| (3) | B_1, \cdots, B_n は互いに排反である | ; 前提 |
| (4) | (A\cap B_i)\cap(A\cap B_j) = \varnothing, ただし i\neq j, i,j\in \{1,2,3,\cdots n\} | ; (1,2,3) より |
| (5) | \displaystyle \bigcup_{i=1}^n \left(A \cap B_i \right) = A | ; (1,2,3) より |
| (6) | \displaystyle P(A) = P\left( \bigcup_{i=1}^n \left(A \cap B_i \right) \right) = \sum_{i=1}^n P\left( A \cap B_i \right) | ; (4,5) より |
| (7) | P(A|B_i) = \dfrac{P(A\cap B_i)}{P(B_i)} | ; 条件付き確率の定義 |
| P(A\cap B_i) = P(A|B_i) P(B_i) | ||
| (8) | \boxed{\displaystyle P(A) = \sum_{i=1}^n P(A|B_i) P(B_i)} | ; (6,7) より |
ベイズの定理
前の定理と同じ文脈において、次の定理が成り立つ:
定理:
P(B_k|A) = \dfrac{P(A|B_k)P(B_k)}{\displaystyle\sum_{i=1}^n P(A|B_i)P(B_i)} = \dfrac{P(A|B_k)P(B_k)}{P(A)}
証明: もし A が任意の事象であり、B_1, B_2, \cdots, B_n が互いに排反な事象の集合で \displaystyle \bigcup_{i=1}^n B_i = \Omega が成り立つとき、複合確率の定理により次を得る:
P(A) = \displaystyle \sum_{i=1}^n P(A|B_i)P(B_i)
ここで、P(X\cap Y) = P(X|Y)P(Y) が成り立つことを用いると、Y=A, X=B_k とすれば次に到達する:
P(A) = \dfrac{P(B_k \cap A)}{P(B_k|A)}
一方で、次が成り立つ:
P(A|B_k) = \dfrac{P(A\cap B_k)}{P(B_k)}
ここから次を導くことができる:
P(B_k \cap A) = P(A|B_k)P(B_k)
さて、緑で示した式を青で示した式に代入すれば、次を得る:
P(A) = \dfrac{P(A|B_k)P(B_k)}{P(B_k|A)}
これは次と同値である:
\boxed{P(B_k|A) = \dfrac{P(A|B_k)P(B_k)}{P(A)}= \dfrac{P(A|B_k)P(B_k)}{\displaystyle \sum_{i=1}^n P(A|B_i) P(B_i)} }
これで示すべきことが示された。
