(1)確率とはなにか?

2023年11月16日

サイコロ遊びをする神という絵を作りたかったが、AIはサイコロのような決まった構造物は苦手のようだ・・・
この節のキーワード
  • 確率の2つの解釈 客観的と認識論的
  • 同様に確からしい
  • 確率の計算

まずは確率の話です。

確率の2つの解釈

確率という言葉は、いろいろなところで使われています。しかし、そこに含まれる意味は異なります。

たとえば、学校のクラスでの係を決めるのにくじ引きになったとしましょう。この場合、クラスの人数と係に必要な人数から確率は計算でき、どのくらい当たりやすいかを考えることができます。

一方で、テレビの天気予報で「明日の降水確率は50%です」といったときはどうでしょうか?明日は何回もあるわけではありません。それなのに確率50%とはどう解釈したら良いのでしょうか?その厳密な意味は分からなくても、「降水確率10%」よりは雨が降りやすく、「降水確率80%」よりは雨が降らない、という判断はできます。つまり、その予報の「強さ」みたいなものを表しているとはいえそうです。

このように確率には、大きく2つの解釈があります。(その折衷的なものも含めて)

1つ目は客観的な解釈で、ある一定の起こりやすさというのが決まっており、それを測定しているのだと考える解釈です。これはくじ引きの例のような確率を全体の回数とその事象が起きた回数の比として確率を考える方法と関係しています。このような確率の考え方を頻度主義といいます。

2つ目は認識論的な解釈で、それがどのくらい起こりやすいのかということへの信念の強さとも言えるものです。

くじ引きの当たる確率や放射線同位体が崩壊する確率は客観的に存在するようにも思えますし、実際に測定することも可能です。とくに量子論によってミクロの世界での出来事がすべて本質的に確率的であるとなった今では、こうした考え方は必須になっています。

一方で「降水確率」の話は違ってきます。頻度主義的な解釈が成立するためには、それがくじ引きやサイコロの目のように繰り返し試行可能であるか、放射性同位体のように多数の集団について考えるか、時間的あるいは空間的に多くのサンプルがあることが前提になってきます。

しかし「明日の降水確率」といったとき、明日は一度しか訪れません。その天気が雨になる確率は頻度主義的な解釈とはなじみません。そこには「明日雨が降るだろう」という予測への<確信度>のようなものが表現されていると考えたほうが自然ではないでしょうか?

ここではまず頻度主義的な確率の方から考えていきます。そのための道具立てをいくつか考えていきましょう。

同様に確からしい

たとえば、サイコロを振って1が出る確率というもの考えます。

サイコロを振ったときにどの目がでるかということを、サイコロの形状・材質や振ったときの初速度などが厳密に与えられれば予測することができるでしょうか。人間や現代のコンピュータには計算できないかもしれませんが、実際にはそうして決定論的に決まっているとわれわれは考えています。十分大きな能力を持つ知能ならばこのようなあらゆる事柄の結果を完全に把握・予測できるだろうと考えたのはフランスの科学者ラプラスです。こうした存在は「ラプラスの魔」と呼ばれています。

某漫画には麻雀で振るサイコロの目を自由にコントロールできる描写がありましたが(実際練習次第ではできると思われます)、そうした作為や細工が全くないと考え、サイコロの目を決める諸条件はいい具合にバラバラだと、ある種の理想化をしてサイコロの目はすべて平等に出やすいものだ、と考えるところから頻度主義的な確率論は出発します。

このような仮定を「同様に確からしい」といいます。実際には上に書いたようにこれはあまり自明ではありませんが、思考の出発点としてこの仮定は必要なわけです。さらに考える対象が連続な変数(角度や長さのようなもの)になってくるとさらにいくつかの困難があるのですが、それはまた別の所で触れたいと思います。

さて、それぞれの事柄が「同様に確からしい」ならば事象Aの確率は頻度の比として定義されます。

確率(頻度主義的定義)

すべての事柄が同様に確からしいならば、ある事象Aに属する事柄の個数を$r$、ありえる全体の事柄の個数を$N$としたとき、事象Aの確率$p$は以下のように定義される。

\begin{equation}
p=\frac{r}{N}
\end{equation}

これは一番なじみのある定義だと思います。

確率の法則

確率の議論をもう少ししっかりとするために言葉の定義をしておきましょう。

事象・標本空間・確率

事象:いま考えている1つ1つの事柄を事象といいます。

標本空間:考えている事象全体の集合を標本空間$\Omega$といいます。

確率:そして、その事象$A$に対して0以上1以下の数値を割り当てるものを確率といい$p(A)$と書きます。とくに標本空間の確率は1となります。つまり、$p(\Omega)=1$である必要があります。

確率に関して次のような性質があるとします。

確率の和

ある事象Aと事象Bがあったとき、集合の数の法則に対応して以下のような法則が成り立ちます。

確率の和

2つの事象AとBがあったとき、それらの確率について次のような性質がある。

\begin{equation}
p(A \cup B) = p(A) + p(B) – p(A \cap B)
\end{equation}

とくにAとBが同時には起こらないとき(これを背反な事象といいます)

\begin{equation}
p(A \cup B) = p(A) + p(B)
\end{equation}

が成り立つ。

これは確率の性質として、事象を併せたときに勝手に確率が減ったり増えたりしてはいけないということです。

独立性

独立性についてはまた別の項目を立てて詳しくみますが、いまのところ次のような形で考えておきます。

独立性

事象Aと事象Bがあって、事象Aが起きるか起きないかということが、事象Bの起きる確率に影響しないとき、これらを独立な事象といいます。

たとえば、2つのサイコロAとBがあったとき、Aの目が1になることとBの目が1になることは独立です。もし「ゾロ目が出やすい」などの細工があればこの限りではありませんが、そういうものはないとするのが独立性の仮定です。

余事象

最後に余事象を定義しておきます。

余事象とその確率

事象$A$に対して、標本空間の残りの事象を余事象といい$\bar{A}$と書きます。

また、確率の性質から

\begin{equation}
p(\bar{A}) = 1 – p(A)
\end{equation}

が成り立ちます。

まとめ

以上の確率の法則は、最初に述べた確率の解釈とは独立に成立します。つまり「確率」がどういう意味なのかはとりあえず置いておいて、数学として一貫性をもった対象となるにはこうした性質を持っている必要がある、ということを決めたものです。

この節のまとめ
  • 確率の解釈には、客観的に数えられる頻度の比としての解釈と、「起こりそうだ」という確信度に関する認識論的な解釈がある。
  • ランダムに起こる事柄の起こりやすさが平等だという仮定を「同様に確からしい」と表現する。
  • 確率計算の基礎となる法則がある。