読者です 読者をやめる 読者になる 読者になる

Take a Risk:林岳彦の研究メモ

自らの研究に関連するエトセトラについてのメモ的ブログです。主にリスク学と統計学を扱っています。

『統計的因果推論:モデル・推論・推測』を読む(その4)

統計 エア輪読

前回からの続きです。いくつか抜き書きしていきます。

今回は「1.4 関数因果モデル」の部分。

本書では、因果関係をLaplaceの準決定論的概念*1を用いて記述し、これを確率的概念と対比させ、因果的な実態を定義し、解析する。この概念を選択した理由は3つある。まず、Laplaceの概念は一般的である。確率モデルはすべて(確率的入力を伴う)多くの関数関係を用いて表現できるが、逆はそうでない。すなわち、限られた場合にだけ、関数関係は確率モデルを用いて近似することができる。第二に、Laplaceの概念は人間の直感と調和している。(中略)


最後に、人間の推論過程に偏在する概念はLaplaceのフレームワークによってのみ定義できる。たとえば、「事象Aが理由となって事象Bが起こった確率」や「もし事象Aが起こらなければ、事象Bは違っていたであろう確率」といった単純な概念は純粋な確率モデルでは定義できない。このような反事実的概念を議論するためには、Laplaceのモデルで表現された決定論的要素と確率論的要素を統合しなければならない。

確率モデルを関数で書くことはできるが、関数を確率モデルで書くことはできるのは限られた場合だけ。だから決定論的関数関係を重視する必要があると。「決定論的要素と確率論的要素を統合」というのは、ざっくりWinBUGS的に言えば、確率的ノード(~)と関数的(決定論的)ノード(<-)を混在させたモデリングを行うこと、ともいえるかもしれません。

一般に、関数因果モデルは
x_{i} = f_{i} (pa_i,u_i), i=1,...,n (1.10)
という形式の方程式の集合からなる。ここにpa_{i}(親を表す)はX_iの直接原因と考えられる変数集合であり、U_iはそれ以外の表現されることのなり誤差を表す。(1.40)式は線形構造方程式モデル(structural equation model; SEM)
 x_i = \Sigma_{x_k \in pa_i} (\alpha_ik x_k) +u_i, i = 1,...,n (1.14)
非線形、ノンパラメトリック・モデルへ一般化したものである。経済学や社会科学では、このモデルが標準的ツールとして使われている(第5章を参照)。線形構造方程式モデルでは、pa_iは(1.41)式の右辺にある0ではない係数を持つ変数に対応している。

関数因果モデルの一般的な記述。


因果ベイジアン・ネットワークの特徴についての記述。この辺りが使いどころとなりそう。

ここで、(1.40)式で定義される関数モデルの特徴と1.3節で定義された因果ベイジアン・ネットワークの特徴を比較する。このために、3つの問題を考えよう。

  • 予測(たとえば、もしスプリンクラーが作動していないことがわかれば、歩道は滑りやすいだろうか?)
  • 介入(たとえば、もしスプリンクラーが作動しないように制御すれば、歩道は滑りやすいだろうか?)
  • 反事実(たとえば、現在、歩道は滑りにくいがスプリンクラーは作動している。この条件の下で、スプリンクラーが作動していなかったら歩道は滑りやすいだろうか?)

これらの問題は、記述レベルが高度になるに従って、多くの知識が必要となる。そこで、これらの問題が根本的に異なる階層を表していることをこれから説明する。

上記の「予測・介入・反事実」という問題は、リスク学の分野においては真に本質的なものなので、この辺りを軸にリスク解析への応用を拓いていけそう。てかいきたい。


1.4節の残りの部分は、以上の「予測・介入・反事実」と因果ベイジアン・ネットワークについての簡単な説明。長くなるので省略。

次回に続きます。


統計的因果推論 -モデル・推論・推測-

統計的因果推論 -モデル・推論・推測-

*1:「自然法則は決定論的に記述され、偶然性は単に潜在的な境界条件を知らないがゆえに現れるにすぎない」