Take a Risk:林岳彦の研究メモ

自らの研究に関連するエトセトラについてのメモ的ブログです。主にリスク学と統計学を扱っています。

発表資料アプ『相関と因果について考える:統計的因果推論、その(不)可能性の中心』

オッス!オラ悟空!(嘘)

さいきんナンプラーに杏ジャムを組み合わせることで、パッタイ的風味*1が出せることに気が付きました。みんなも是非やってみてくださいね。

あと、さいきん研究所内のカジュアル系セミナーで「相関と因果について考える:統計的因果推論、その(不)可能性の中心」というタイトル*2で発表をいたしましたのでそのプレゼン資料を晒してみます。

要旨はこちら:

相関関係と因果関係は同じではない。しかし研究や行政の現場においては、しばしばその両者が明確に区別されぬまま議論が行われている。全く由々しき問題である。


本発表では、近年発展してきた「統計的因果推論」という本質的かつマニアックな分野の知見をもとに、「相関と因果」の関係についてできるだけ分かりやすく整理したい


前半では、統計的因果推論における幾つかの基礎概念について解説する。まず、哲学界における因果概念の変遷について触れ、因果概念を「反事実的依存性」という観点から捉えうることを示す。その後、Judea Pearl流の統計学的因果推論のキー概念となる「do演算子」について解説を行い、「因果と相関」の区別についての理論的な整理を行う


後半では、我々が実務上取り扱うことの多い「重回帰分析」を統計的因果推論の視点から再考する。まず、「重回帰とは"因果構造分解酵素"である」というテーゼについて解説し、重回帰分析は現象の背景にある因果構造をかなり大胆に簡略化していることを示す。また、統計的因果推論の視点からの変数選択基準である「バックドア基準」についての解説を行う。最後に、統計的因果推論の不可能性およびモデル選択についての議論を行う。


以下備忘録も兼ねた自己コメント:

  • 今回はiPadを用いてスライドに書き込みしながらプレゼンしますた
  • プレゼン時に使ったソフトはGoodReaderです*3
  • 資料自体はKeynoteで作成してPDFに書き出し
  • プレゼン時は常にFreehandの書き込みモードで進めました
  • スライドの上部のスペースが常に若干空いているのは書き込みモード時のツールバーがそこに表示されるからです
  • iPadでのプレゼン自体の感想は上々っぽい
  • やっぱりリアルタイムで書き込めると図の説明はやりやすい。あと聴者のattentionを保持するのにも有効かも
  • でもiPadを手に持って立ってプレゼンしてたらiPadVGAの変換プラグが抜けた(これ緩すぎるぞ>apple
  • しょうがないからその後はiPadを机の上においてプレゼンしたよ
  • 発表内容については、こういうストーリー展開でまとめたプレゼンはおそらく今までにあんまり無いと思う*4
  • でも頑張ってまとめたけど細かい部分で間違っているところももしかしたら多いかもしれない(土下座)
  • 各トピックの専門家から見たらテクニカルタームの使い方とか雑すぎるかも
  • でもこのへんまでがもう俺は限界かもしれない
  • 今回まとめてみたことでまず「自分の理解が半端であること」がよくわかった
  • 特に「反事実的依存性」からdo演算子へと繋ぐところの展開がいまいちスムーズじゃない気がする*5
  • 前提知識が全くない人にバックドア基準を説明するとたぶんこのスライドのようなかんじになると思うのだけれど、この要約の仕方で適切だと思ってはいるのものの完全には自信ない
  • この説明の中での選択バイアスの位置づけには迷った
  • フロントドア基準は今回はパスでお願いします
  • 総合効果とか間接効果とかの説明もどこかですればよかったかなぁ
  • たぶん随所に私の立ち位置(リスク研究or生態学)からのバイアスがかかっているように思います
  • 宮川氏の名著「統計学的因果推論」をもう一度精読してみようと思いました
  • ていうか「counterfactual/反事実的」って言葉の響きは俺たちの厨二マインドにジャストミートしちゃうよね!


この辺のトピックについてはブログ記事としてもいよいよ順次書いていきたいと思います。何卒よろしくお願いいたします。

(おまけ)関連情報

関連する自エントリ:
確率と因果を革命的に架橋する:Judea Pearlのdo演算子 - Take a Risk: 林岳彦の研究メモ
因果グラフからみる交絡問題:「遺伝統計学における因果問題の特殊性」について考えてみた - Take a Risk: 林岳彦の研究メモ
統計的因果推論(傾向スコア)の勉強会資料をアプしてみた - Take a Risk: 林岳彦の研究メモ


他の方々の関連するっぽいエントリなど:
反事実的状況のマクロシミュレーション - 社会学者の研究メモ
(非計量さん向けの)統計学の話:バイアス編 - 社会学者の研究メモ
因果推論のススメ - iAnalysis 〜おとうさんの解析日記〜
交絡 - Wikipedia
Bradford Hill criteria - Wikipedia, the free encyclopedia


参考にさせていただいた主な書籍:

統計的因果推論―回帰分析の新しい枠組み (シリーズ・予測と発見の科学)

統計的因果推論―回帰分析の新しい枠組み (シリーズ・予測と発見の科学)

統計的因果推論 -モデル・推論・推測-

統計的因果推論 -モデル・推論・推測-

多変量解析の展開―隠れた構造と因果を推理する (統計科学のフロンティア 5)

多変量解析の展開―隠れた構造と因果を推理する (統計科学のフロンティア 5)

.

*1:より正確にいうと「あみアウトレットモール」のフードコートのパッタイの風味

*2:タイトルはネタ

*3:GoodReaderから普通にプロジェクター出力が可能

*4:導入は[http://synodos.livedoor.biz/archives/1480404.html:title=菊地誠さんのやり方]をパクろうとおもったのですが、「テレビの台数」のデータが見つからなかったのでNHK契約数になってしまった

*5:この辺はRubinの枠組みのほうが説明しやすいよなぁ