Take a Risk:林岳彦の研究メモ

自らの研究に関連するエトセトラについてのメモ的ブログです。主にリスク学と統計学を扱っています。

低頻度高被害型リスクについて考える(2/3):不確実性の問題

前回に引き続き、今回も

「10日に1度の確率で10人が死ぬ事象」と「10万日に1度の確率で10万人が死ぬ事象」は、どちらも「1人死亡/1日」という同一の表現で表すことができるけれども、それは本当に同一なリスクとみなして良いのだろうか?

という問いについて考えていきます。

実務的な観点から見ると、それらの事象から得られる「1人死亡/1日」という推定値に関しては、値そのものは同じだけど、その値や推論の「素性」はかなり違うよなーという印象を受けます。

今回は、そんな印象について「推論法の違い(帰納メインか演繹メインか)」および「不確実性の違い」という観点から説明してみたいと思います。説明のためにちょっと原理的なところから話をはじめますので、今回もかなり回り道をした長い説明になりますが本当にすみません(平謝り)。

2つの推論方式:帰納的推論と演繹的推論

まず、そもそも推論方式には大きく分けて「演繹的推論」と「帰納的推論」がある、という話からしたいと思います*1

帰納的推論とは、個別の事例(データ)から一般について推測するというタイプの推論です。具体的には:

「ネコaはネズミを追いかける」「ネコbはネズミを追いかける」「ネコcはネズミを追いかける」... → 結論:「全てのネコはネズミを追いかける」

というかんじの推論になります。

一方、演繹的推論とは、所与の前提を基に論理的に帰結を導くというタイプの推論です。具体的には:

前提A「岡村靖幸は人である」+前提B「人は必ず死ぬ」→ 結論C「岡村靖幸は必ず死ぬ」

というかんじの推論になります。

帰納・演繹推論の利点と欠点:理想的な科学的推論とは

一般に「科学的推論」は、帰納的推論と演繹的推論の両者によって支えられていることが望ましいといえます。なぜなら、帰納的・演繹的推論のどちらにも固有の利点と欠点があるからです。


例えば、帰納的推論は、常に間違いうる可能性を持つ不完全な推論であるという本質的な欠点があります。具体的には:

「ビールには水が入っている」「ウィスキーにも水が入っている」「ブランデーにも水が入っている」 → 結論:「水を飲むと酔っ払う」

という誤った結論を導いてしまう可能性が帰納的推論には常にあります。ざっくり言ってしまうと、帰納的推論というのは「個別から一般への拡大解釈」なので、そりゃいつだって間違える可能性があるのです。特に、いわゆる"ブラック・スワン"のようなケースでは、帰納的推論は多くの場合役に立ちません。どんなに数多くのデータがあったとしても、いままでに観測された現象の全てが「白いスワン」である場合に、この世界に「黒いスワン」も存在するということは帰納的推論では予測しようがないのです。

「科学的」と呼ばれる推論の多くの部分は帰納的推論により行われます。そのため、その帰納的推論に基づく「科学的推論」はいかなる意味でも「間違いの無いこと(無謬性)」の保証とはならないので注意が必要です*2


一方、演繹的推論は、正しい論理に基づき推論するならば常にその推論は「論理的には」正しいという完全な推論方法といえます。そのため、適切な演繹的推論を用いれば「いままで観察されたことがない類の現象=ブラックスワン」についても原理的には予測が可能となります。

ただし、演繹的推論も、そもそもの前提が間違っていたりすると、間違った推論結果になります。例えば:

前提A「オバケは人である」+前提B「人は必ず死ぬ」→ 結論C「オバケは必ず死ぬ」

のように「オバケは人である」という間違った前提のもとに推論をすると、間違った結論が導かれてしまいます。

また、科学における演繹タイプの推論(前提Xであるゆえに結論Yである)の骨子をなすのは「モデル(現象の世界と論理の世界を結ぶための概念模型)」ですが、この「モデル」の部分が適切でないとこれもどうにもなりません。これも実務的には非常にリアルな問題です*3 *4

このように、演繹的推論が適切であるためには演繹的論理の背景にある「前提」と「モデル」が適切である必要があります。そして、実はそれらの「前提」や「モデル」の正しさというのは多くの場合「帰納的推論*5」によってしか確かめることができません。例えば、「モデルが現実世界の問題と適切に対応している」かどうかを調べるには基本的にはモデルと実データを照らし合わせてチェックするしかありません。

そのため、現実的には演繹的推論といえどもその「確からしさ」については「帰納的推論」に多くを依存しています。上述したとおり、帰納的推論は本質的に「個別から一般についての拡大解釈」なので、常に間違えうる可能性があるものです。そのため、帰納的推論に依るものでも演繹的推論に依るものでも、「推論が科学的であること」はいかなる意味でも「間違いの無いこと(無謬性)」の保証とはならないので注意が必要ということになります。


では、次善の策として「相対的に間違いが少ない科学的推論」を目指す場合にはどのような推論方法に依るのが良いでしょうか?

一般論としては、帰納的推論と演繹的推論の両者によって支えられた「科学的推論」が理想的であるといえるでしょう。「帰納的推論」と「演繹的推論」という2本の性質の異なる柱の上に推論を展開することにより、お互いの推論方式の欠点を補いあうことが期待できるからです。

リスク分析における演繹と帰納:『確率』と『統計』の違い

ここで、ちょっと唐突かもしれませんが、上記の「帰納/演繹」の話を「リスク分析」の話へと橋渡しすることをねらいとして、ちょっと『確率』と『統計』の違いについて書いてみたいと思います。

教科書などでよく「確率・統計」という題名のものがありますよね。さて、これらの教科書において『確率』と『統計』の章というのは具体的にはどういう区別で分けられているのでしょうか?

一般に、このような教科書における『確率』の章は、確率に関する演繹的推論(演算規則)に関わる内容となっています。つまり:

サイコロを3回投げて3回とも1が出る確率は「(1/6)×(1/6)×(1/6)=1/216」である

というような演算規則を習うのがこういう教科書における『確率』の章の部分です。数学の演算規則というのは本当に純粋な演繹的論理体系ですので、『確率』の章では、確率概念を用いた「演繹的推論」に関する内容が扱われていると言えます*6


一方、教科書などにおける『統計』の章では、「データに基づき何かを推測する」という「帰納的推論」に関する内容が扱われています*7


上記の『確率』も『統計』もまさにリスク分析におけるメインウェポンといえるものですが、細かいニュアンスを言うと、『確率』の方は演繹的ツールであり、『統計』の方は帰納的ツールであるという性質の違いがあるわけです。

高頻度事象の分析は帰納的推論(『統計』)の世界

では、やっと本題のリスク分析の話をしていきたいと思います。

リスク分析の立場から見たときの「高頻度事象」の特徴としては、「統計的アプローチが安心して使える」という点を挙げることができます。

例えば、「10日に1度の確率で10人が死ぬ事象」という事象であれば、10000日(=10日×1000=約27年)ほどの観測があれば、その確率事象としての全貌を十分な確度で把握することができそうです。このレベルの頻度で起きるものならば、得られたデータのヒストグラムを描くだけで確率分布の形がほぼ把握できるでしょうし、確率分布のパラメータ(平均値など)もかなりの精度で把握することができそうです*8

また、高頻度で起こる事象では、そのメカニズムの解明なども比較的容易であることが多く、演繹的推論によるアプローチも使えることが期待できます。

そのため、高頻度事象に対する推論は、「演繹的推論」と「帰納的推論」の2本の柱に基づき展開できることが多く、相対的に確度の高い推論が期待できます。

低頻度事象の分析は演繹的推論(『確率』)の世界

一方、リスク分析の立場から見たときの「低頻度事象」の特徴は、「統計が(安心しては)使えない」ということになります。

例えば、「10万日(=約270年)に1度の確率で10万人が死ぬ事象」という事象については、10億日(=10万日×1000=約27万年)ほどの観測がないとその確率事象としての全貌を十分な確度で把握することはできないかもしれません。ある事象を帰納的推論の枠組みに落としこんで考えるには、事象が起こる頻度に対して十分に長い期間の系列を観察することが本来は望ましいものです(過去記事)。しかし、低頻度事象については、十分に長い期間の観察を行うことが原理的に難しいので、確度の高い帰納的推論を行うことは非常に難しくなります。

そのため、低頻度事象に対しては「統計(帰納的推論)」というよりも「確率計算(演繹的推論)」によってそのリスクを理論的に求めるしかなくなります


そのような、理論的にリスクを推論する「確率論的リスク評価」の典型例としては、原子力プラントの確率論的リスク評価が挙げられるでしょう。例えば、こんな感じの計算がされています(引用元)。


ここでは、事象の起こる確率(P1, P2, ...)をどんどんかけ合わせていくことにより、理論的(演繹的)に事故発生のリスク(発生確率)が推定されています。基本的に、手法としては

サイコロを3回投げて3回とも1が出る確率は「(1/6)×(1/6)×(1/6)=1/216」である

という、教科書の『確率』の章で習った方法の素直な延長線上にあるものであることが見て取れるかと思います。


さて、このような理論(演繹的)計算により求められたリスク推定値の特徴は、ざっくり言ってしまうと、「けっきょくのところ理論値に過ぎない」ということです*9
理論値でも何も無いよりはずっと良いですが*10、「演繹的推論」と「帰納的推論」の2本の柱により支えられているようなリスク推定と比べると、このような理論計算のみにおけるリスク推定の「確かさ」は残念ながら相対的にはかなり低いものとならざるを得ません。

低頻度事象のリスク分析では「帰納的推論(統計)」が安心して使えないので、どうしても「演繹的推論(理論計算)」という「1本の柱」のみの上でリスクの推論を行うことしかできない、そのためにどうしても不確実性が大きくならざるを得ない、という宿命があるわけです。

まとめ:低頻度事象と高頻度事象ではそもそも得られた"リスク推定値"の性質がかなり違う

というわけで、「高頻度事象」と「低頻度事象」に対するリスク分析の性質の違いについて書いてみました。

以上に述べたような、「高頻度事象」と「低頻度事象」に対するリスク分析の性質(帰納メインか演繹メインか)の違いを踏まえた上で、

「10日に1度の確率で10人が死ぬ事象」と「10万日に1度の確率で10万人が死ぬ事象」は、どちらも「1人死亡/1日」という同一の表現で表すことができるけれども、それは本当に同一なリスクとみなして良いのだろうか?

という問いを眺めると、

値そのものは同じ(1人死亡/1日)だけど、値や推論の「性質」はかなり異なるんだよなー

という印象が生まれてくるというわけなのです。


いわゆる「科学的リスク評価」と呼ばれるものの範疇には、以上で述べてきたような、高頻度事象に対する帰納的推論ベースの分析も、低頻度事象に対する演繹的推論ベースの分析も、その両方が含まれるものと思われます。しかしながら、実はその両者の「科学的確からしさ」というものの間にはけっこう大きな濃淡の差があるのです。

このような「確からしさの濃淡」というのはなかなか実務レベルに近い人でないと見えづらいのかもしれませんが、リスク管理を行う上ではこのような「確からしさの濃淡」というものを常に意識して値を見ていかないといけないのです。

なので本当は、リスクの値を「出す」ためだけではなく、リスクの値を「読む」ためにも専門家って必要なんですよねぇ。


(*本当はこの話の続きとして、『低頻度高被害リスクの「期待値」にはたぶんあまり意味はない』という節を書くつもりだったのですが、あまりにも長くなってしまったので次回に書くことにしました。)

追記:低頻度事象のリスク分析も無意味どころかとっても大事だよという話

追記をすこし。

上記では、低頻度事象のリスク分析の「科学的確からしさ」は相対的に低くならざるを得ないと書きました。しかし、だからと言ってこのような分析が無駄というわけではありません。たとえ定量性は余り高くなくとも、非常に重要性の高い半定量的な示唆が得られることがあるからです。

例えば、実はH21年の原発のリスク分析でも「津波→電源喪失→炉心損傷」のリスクの高さは正しく分析できていたようです(以下、原子力安全基盤機構による地震リスク分析資料のp3-4からの引用 )。

図 3.5 及び図 3.6 から分かるように、本解析条件のもとでは、津波の波高が一定値以上(防波堤の効果を考慮しない場合には約 7m、考慮した場合には約 15m)の場合に条件付炉心損傷確率がほぼ 1.0 となり、炉心損傷頻度(相対値)は津波発生頻度(相対値)とほぼ同一となる

何故この分析結果が活かされなかったのか、本当に本当に悔やまれます。

関連図書

An Introduction to Probability and Inductive Logic

An Introduction to Probability and Inductive Logic

明日をどこまで計算できるか?――「予測する科学」の歴史と可能性

明日をどこまで計算できるか?――「予測する科学」の歴史と可能性

*1:アブダクションについては今回はパス

*2:しかし多くのばあい「間違いが相対的に少ないこと」の保証にはなるでしょう/現実的にはその「相対的」の程度が問題となります

*3:計算機シミュレーションのアナロジーでいうと、「前提」というのはシミュレーションの入力値、「モデル」というのはプログラムの式となります。入力値が間違っていたりプログラムの式が不適切だったりすると、演繹的推論(数学的演算)自体は可能であるとしても、間違った推論結果しか得られません

*4:そもそも、「適切なモデルとは何か」というのを考え出すとこれも非常に難しい問題です。そこには少なくとも、「論理として(例えば数学的に)正しい」という「正しさ」と、「論理が現実世界の問題と適切に対応しているという意味で正しい」という意味での2種類の「正しさ」があるように思います。また、そもそものそもそものことを言えば、そこには「なぜ現象と論理を結ぶことが可能なのか」という深い問題が横たわっています。なぜそもそも物理現象を数学で記述することが可能なのでしょうか? それは神秘としかいいようがないように思われます。

*5:アブダクションを含む

*6:このような確率演算の体系の基礎は17世紀にパスカルやフェルマーにより築かれました

*7:多少細かくいうと『統計』の区分の中でも、「部分(サンプル)から全体について推測する」ことに関する部分を「統計的推測」と言います。(推測を交えずに記述するだけのものを「記述統計」といいます。)このような「統計的推論」を確率論的演算により行う、つまり「帰納的推論を純演繹的推論体系(数学)の力で行う」という非常にアクロバティックな試みが実用化されたのは20世紀の初頭であり、このような「統計的推測」のやり方を学ぶのが『統計』という教科における主な内容ということになります。帰納的推論を演繹的推論の枠組みの中に投げ入れるというアクロバットを可能とするための方法としては、現在までに少なくとも2つのタイプのものが発明されています。その一つがトーマス・ベイズによる「ベイズの定理」です。もう一つは天才R.A.フィッシャーなどにより完成された「標本抽出に基づく推測理論」です。現在の統計的推測の世界には、ざっくり言うと、それぞれの方法に基づく統計的推測の体系として「ベイズ統計」と「頻度主義統計」の2つの主な流派があります。

*8:このようなタイプの具体例を言えば、たとえば自動車事故のような高頻度事象のリスク分析(自動車保険)では、統計的アプローチを利用することによりかなり確度の高いリスク分析が可能となっています。

*9:自分で書いてて耳が痛い

*10:個人的にはここも強調したいところ