(3)条件付き確率

この節のキーワード
  • 条件付き確率
  • 情報の使い方

今日の話は条件付き確率です。

条件付き確率とはなにか?

条件付き確率とは、「ある情報のもとで確率を再計算する」といえます。そのことを説明していきます。

いま次のように、全事象$\Omega$、事象A、事象Bがあるとしましょう。

いま、頻度主義的に確率を定義するならば、
\begin{eqnarray}
P(A) = \frac{n(A)}{n(\Omega)} \\
P(B) = \frac{n(B)}{n(\Omega)}
\end{eqnarray}

となります。また、AとBの共通部分$A \cap B$は空ではないとしておきます。

さて、いま「事象Aが起きている」という情報を得たとします。このときに事象Bが起きる確率はどのように変化するでしょうか?

事象Aが起きているのは確実なのですから、全事象を事象Aだと改めて確率を考えます。事象Bの方も事象Aから外れてしまう部分については考えなくてよいということになります。したがってこのときの事象Bの起きる確率は、

\begin{equation}
P_A(B) = P(B|A) = \frac{n(A \cap B)}{n(A)} = \frac{n(A \cap B)/n(\Omega)}{n(A)/n(\Omega)} = \frac{p(A \cap B)}{p(A)}
\end{equation}

となります。ここで最初の2つの記号は同じ意味で、「Aという条件のもとでのBが起きる確率」ということを表します。高校数学などでは前者の表記が一般的ですが、条件が長くなると分かりにくくなるので当ブログでは2つ目の表記を用いることにします。

また今回は頻度主義的に要素数nを挟んで考えましたが、今後はこのプロセスは省略して確率の関係だけで話を進めていきます。

上の結果をまとめておきます。

条件付き確率

条件Aのもとで事象Bが起きる確率を条件つき確率といい、$P_A(B)$あるいは$P(B|A)$と表す。これは、

\begin{equation}
P_A(B) = P(B|A) = \frac{p(A \cap B)}{p(A)}
\end{equation}

で求められる。

ここで一つ重要な注意点があります。

いま逆に事象Bが起きていることがわかっていて、その条件のもとでの事象Aの確率を考えると、

このようにBを全事象として考えるわけですから、

\begin{equation}
P(A|B) = \frac{p(A \cap B)}{p(B)}
\end{equation}

となります。分母が違いますから当然$P(A|B) \neq p(B|A)$です。条件と結果を逆にすればその確率も変わることはある意味当たり前ではありますが、けっこう忘れがちというのと、この「逆の確率」を求めるには特別な定理(ベイズの定理)が必要になってくるということを意識する必要があります。これは「前書き(2)」でも書いたことにも通じる話です。

サイコロ当てゲーム

では、実際にこの公式を使ってみましょう。

いまあなたはサイコロを1つ振った結果を当てるゲームをしているとします。

このとき選択肢は1~6の6通りあります。サイコロはとくに細工もないとしてすべての目は平等に出るとします(同様に確からしい)。

あなたが適当な数字として2を選んだときに当たる確率は$x=\{1,2,3,4,5,6 \}$として、

\[ p(x=2) = \frac{1}{6} \]

です。

さて、あなたはゲームの相手から「目は偶数です」というヒントをもらいました。ヒントが正しいとして確率はどう変化するでしょうか?

目が偶数なのですから、1,3,5の3つの可能性は消えます。

したがって、

\[ p(x=2|xは偶数) = \frac{1}{3} \]

です。ここで「目が偶数」というヒントは確率を変化させる情報としての意味があったことが分かります。

このことは公式を使っても分かります。偶数が出る確率は$\frac{1}{2}$ですから、

\begin{equation}
p(x=2|xは偶数) = \frac{\quad p(x=2) \quad}{p(xは偶数)}=\frac{\frac{1}{6}}{\frac{1}{2}} = \frac{1}{3}
\end{equation}

となって同じ結果が得られました。ただし、最初の「可能性をすべて考えた上で条件に当てはまらないものを消す」というやり方も意外と便利なことがあります。

子どもの性別

つぎのような問題を考えてみてください。

問題3-1 子どもの性別

いまあなたはあるお宅に伺おうとしています。そのお宅には子どもが2人いるということが分かっていますが、性別は分かっていません。男女の生まれる確率が同じと仮定して、つぎの3つの場合について考えてください。

(1)このお宅に男の子がいる確率はいくらか?
(2)このお宅に行ってみると女の子が出迎えてくれた。このお宅に男の子がいる確率はいくらか?
(3)ある人から「あのお宅の子どもの少なくともどちらかは女の子らしいよ」という話を聞いた。このお宅に男の子がいる確率はいくらか?

さてこの問題を正しく解けるでしょうか?

(1)このお宅に男の子がいる確率はいくらか?

まず、考えられるパターンをすべて考えます(全事象$\Omega$)。

この場合、(男、男)、(女、男)、(男、女)、(女、女)の4パターンがあります。そのうち、男の子がいるのは3つなので、確率は$\frac{3}{4}$になります。

(2)このお宅に行ってみると女の子が出迎えてくれた。このお宅に男の子がいる確率はいくらか?

この場合、上の表でいえば1段目の「一人目が男の子」という場合が消えます。よってこの情報からは次のようになります。

したがって、残り2パターンのうち男の子がいるのは1つですから、確率は$\frac{1}{2}$になります。

(3)ある人から「あのお宅の子どもの少なくともどちらかは女の子らしいよ」という話を聞いた。このお宅に男の子がいる確率はいくらか?

この情報で消えるのは(男、男)の一つだけです。

したがって、男の子がいる確率は$\frac{2}{3}$になります。

このように、情報でどのパターンが消えるのかを考え、それによって全事象を更新することによって条件付き確率を求めることができます。そして、ここでも「情報が確率の見積もりを変える」ということが実感できると思います。

この節のまとめ
  • ある条件Aのもとで事象Bが起きる確率を条件付き確率といい、$P(B|A)$と表す。
  • 条件付き確率は以下の式で求められる。
    \begin{equation*}
    P(B|A) = \frac{p(A \cap B)}{p(A)}
    \end{equation*}
  • $P(B|A) \neq P(A|B)$である。
  • 新しい情報のもとで「消えるパターン」を考えることでも条件付き確率は計算できる。