Take a Risk:林岳彦の研究メモ

自らの研究に関連するエトセトラについてのメモ的ブログです。主にリスク学と統計学を扱っています。

『統計的因果推論:モデル・推論・推測』を読む(その3)

前回からの続きです。今回は因果ベイジアン・ネットワークについての説明。

第一章 確率、グラフ、因果モデル入門 「1.3 因果ベイジアンネットワーク」

冒頭を引用します(p22)。

条件付き独立関係を記述するツールとしてDAG*1を解釈することはできるが、それは必ずしも因果関係を意味するものではない。実際、DAGは任意の変数順序に従った逐次的な独立関係の集合に対して適用可能であり、因果的な順序や時間的な順序を必要としない。一方、統計学人工知能の応用分野の至るところでDAGモデルが使われているが、それは本来(しばしば無意識のうちに)因果的解釈を行うことに由来している、すなわち、DAGモデル一つひとつは、観察データの生成過程を説明可能なプロセスのシステムを表現したものである。因果的な解釈を行うことによって、DAGモデルが時間的な順序や因果的順序でよく使われる理由を説明することができる。

DAGそれ自体は必ずしも因果関係を意味するものではないらしいですね。

相関情報ではなく因果的情報に基づいてDAGモデルを構築する利点についていくつか抜き書きメモをします:

相関情報ではなく因果的情報に基づいてDAGモデルを構築する利点はいくつかある。第一の利点は、モデル構築を行う際に必要とされる判断は意味があり、かつ利用しやすく、信頼できるというものである。

因果関係に基づいてベイジアン・ネットワークを構築する第二の利点は、因果構造の理解に基づくものであるが、外的あるいは自発的変化を表現し、反映させることができるということである。状況に応じて部分的なメカニズムを再構成する場合には、わずかに修正するだけでそれと同型なネットワーク・トポロジーに再変換することができる。

この辺の利点は、現時点でも読んでもピンと来ませんが、きっとのちのち納得できるだろうと期待。


因果ベイジアン・ネットワークの背後にある哲学として、「確率関係よりも因果関係を重視する」というものがあるらしいですが、その辺りの説明もメモしておきます(強調原文ママ)。

このように因果関係を理解することによって、なぜ、そしてどうして因果関係が確率関係よりも定常的であるのかがよくわかる。因果関係は、我々の世界についての物理的な制約を客観的に表現しているので存在論的であるが、確率関係は世界について我々が知っていること、あるいは信じていることを表現しているので認識論的である。この違いは、定常性によって生じていると考えられる。したがって、因果関係は、環境に対する認識が変わったとしても、その環境に変化が起こらないかぎり不変である。これを説明するために、「スプリンクラーの状態は雨量に影響を与えない」という因果関係S1を考え、これと確率的に対応するS2「スプリンクラーの状態と雨量は独立である」を比較しよう。S2は変化するが、S1は変わらない2つのケースを図1.2に与えた。まず、季節(X1)がいつなのかがわかるとS2は偽から真に変わる。一方、その季節が分かったとき、歩道が濡れている(X4=真)であるとわかると、S2は真から偽に変化する。しかし、S1は季節や歩道に関する情報とは関係なく真である。


この例には、因果関係が対応する確率関係よりも定常であるという強い意味、そしてそれらの基礎となる存在論的-認識論的な違いを超えた意味がある。季節からスプリンクラーへの影響を規定するメカニズムが変化しても、S1で記述されている関係は変わらない。実際、この因果ダイアグラムで記述されるすべてのメカニズムにおいて変化が起こっても、S1は不変である。このことから、因果関係はメカニズムの部分的変化に対しては感度が高いが、存在論的な変化に対しては強い頑健性をもつことがわかる。さらにいうならば、確率関係とは大きく異なり、因果関係S1は因果的な変数(この例ではX3)を規定するメカニズムによって変わることはない。

確率的関係よりも因果的関係の方が頑健だし重要だよね、というお話。


このような観点が、例えば構造方程式のようなものとどう関連するかについては気になりますが、その辺りについては次節で書かれているようです(次回に続く)。


統計的因果推論 -モデル・推論・推測-

統計的因果推論 -モデル・推論・推測-

*1:非巡回有向グラフ