(2)演繹と帰納/順問題と逆問題

星々の動きから、人類は様々なことを学んできた。 (stable diffusionで生成 model: beautiful realstic/prompt: starry sky on the water)

前書きのようなもの(2)は、人間の思考の方向性について考えたいと思います。これは条件付き確率やベイズ統計、さらには機械学習といったものを考える際に大きく影響してきます。

ここで取り上げる「演繹と帰納」「順問題と逆問題」は構造としてはかなり似ていますが、時間軸のあり・なしが大きな違いでしょうか。

演繹と帰納

この言葉は、よく使われるのでご存知の方も多いでしょう。

演繹と帰納

演繹:一般論から個別の事例について考察すること。

帰納:いくつかの個別事例から一般的な結論を導き出すこと。

前書き(1)で書いた内容は、「帰納」という思考がどうやって成立可能なのか、ということを少し考えたことになりますが、ここではどちらもできるとして、その違いについて考えてみます。

以下では惑星の運動に関する法則を例に考えてみましょう。

こうした分野の基礎には、16世紀デンマークの天文学者ティコ・ブラーエたちが集めた膨大な惑星の位置データがありました。ティコはこれらを使って、天動説と地動説の折衷的な宇宙観(地球を中心に月と太陽が回っており、太陽の周りをその他の惑星が回っている)を作りました。

一方、助手のケプラーはコペルニクスに近い立場で、「地球を含む惑星は太陽の周囲を楕円軌道で運動している」という宇宙観を作り、惑星の速度や軌道の大きさ・周期の関係を含む法則を作りました。これはいまでもケプラーの3法則として残っています。

これは、個々の惑星の位置というデータから、それらが従う一般的な法則を導き出したという意味で「帰納」といえるでしょう。

その後、新たな惑星が発見されたとして(実際に、その後天王星・海王星、いまは惑星とはされていない冥王星などが発見されています)、それもケプラーの法則に従うはずだとして考えるのが「演繹」ということになります。(ここでは説明のためにケプラーの法則と書きましたが、実際には万有引力の法則を使って考えることになります)

順問題と逆問題

さて、ケプラーの法則は「惑星の軌道・運動はこうなっている」という事実を記述するものとして、一般的な法則といえますが、「なぜそのような軌道をとっているのか?」という<原因>にまでは言及していません。

これについて解答を与えたのがニュートンの「万有引力の法則」です。つまりこれは、

「惑星の運動をそのようにさせている原因はなにか?」

という問いへの答えです。こういう「結果」から「原因」を導き出す方向の思考を「逆問題」といいます。

一方、ニュートンの友人ハレーは、ある彗星の周期を万有引力の法則から計算し、次にその彗星が現れる時期を予測しました。これが後に「ハレー彗星」と呼ばれることになる彗星ですが、こうした「原因(この場合、観測された彗星の位置と速度)から法則を用いてその後の結果を予測する」ことを「順問題」といいます。

順問題と逆問題

順問題: 原因 → 結果 の方向で考える

逆問題: 原因 ← 結果 の方向で考える

一般的には順問題の方が逆問題よりも簡単なことが多いわけですが、統計学の対象となる「統計モデル」などはまさに逆問題を考えていることになります。

統計学における順問題と逆問題

たとえばある病気の簡易検査について、それがどれだけ正しいのか知りたいとしましょう。この病気かどうかをほとんど確実に診断できる検査・規準があったとして、その簡易検査でどのような判断ができるか、ということを考えます。

「この簡易検査の感度はいくらか?」

という問題は、「その病気に罹患している人」(=原因)を対象にこの検査を行い、実際に陽性になるか(=結果)を調べれば良いので、これは順問題です。

その結果、

「この簡易検査の感度は90%です」

という結果が得られたとしましょう。このとき、

「簡易検査の結果が陽性になった人が、実際にこの病気に罹患している確率はいくらか?」

と考えることは、結果から原因を推定していることになるので、逆問題となります。

この問に答えるには、罹患していない人が陽性になる確率=偽陽性率と、その検査を受けた人がどの程度罹患している可能性があるかという事前の見積もり(検査前確率)が必要になります。これらを用いて逆問題に答える方法がベイズ確率です。詳しいことはベイズ統計のところでみていきたいと思います。

なにか問いを立てたとき、それが順問題なのか逆問題なのかを意識することは、その問いの難しさや適している方法を考える上で重要な観点になります。