Take a Risk:林岳彦の研究メモ

自らの研究に関連するエトセトラについてのメモ的ブログです。主にリスク学と統計学を扱っています。

夏の因果推論祭りのフォローアップをこんなに遅れて書くつもりじゃなかった

こんにちは。フリッパーズ・ギターの性格が悪い方こと林岳彦です。

さて。

私も大人でありますので本業に追われることもままあります。そして追われているうちにすっかりご無沙汰してしまいました。はてはて。去る7/11に行われた因果推論祭りについてもブログにはまだ何も書いておりませんでした。申し訳ありませんでした。

まだ色々と余裕がないので、以下、雑感の書き散らしになりますがどうかご容赦を:

なにはともあれご講演をいただいた星野先生&黒木先生に感謝しております

いや本当に感謝あるのみです。大変ありがとうございました。

そして聴講にお越しいただいた方々に感謝いたします

おかげさまで130人の教室がほぼ満員状態になるほどの方々にお越しいただけました。
大変ありがとうございました。

告知がネットやtwitterを中心に広まったこともあり、それぞれに面識も無くまた特に共通のバックグラウンドもない方々が集まり、普段の学会や勉強会とは何かしら異なる雰囲気でした。正直、登壇したときは、いつもより聴講者が「得体の知れない」気がして、近年になく緊張しました。(話をしているうちに和らぎましたが)

幾人か「中の人」にお会いできました

はてなブログ等でご活躍されている幾人かの「中の人」に直接ご挨拶することができました。
直接ご挨拶するのは照れくさいような面映いような、でも嬉しいものですね。
今後とも是非ともよろしくお願いいたします。

セミナーのレベル設定について

レベル設定は難しかったですね。聴講者のバックグラウンドも知識レベルも様々であり、レベル設定が高すぎて付いていけなかった方も、逆に低すぎて物足りなかった方もおられたかと思います。せっかく来ていただいたのに申し訳ない気持ちでいっぱいです。。(皆それぞれお忙しい中で貴重な時間を割いて来てくださっているわけで社交辞令ではなく本当に申し訳なく思っています)

「Pearl vs Rubin」という"アングル"について

私の告知文のせいで「Pearl vs Rubin」というアングルでの議論になりましたが、(人間的な部分でのエピソードの面白さはともかくとして)両者の理論のそもそものスコープの広がりを考えると、「Pearl vs Rubin」というのはあまり両理論の面白さのコアの部分を引き出すアングルではないのかもなあとも思いました(←今更)。

Rubinの潜在的結果変数の枠組みは、実解析において頻繁に直面する、欠測値等を含む「観測されなかったデータ」に対するアプローチとして非常にgeneralなリーチを持つという理論的なワクワク感があります。

一方、Pearlの枠組みは、これまた実解析において頻繁に直面する、(例えば)重回帰分析での変数選択において(AIC等とは全く理論的なレイヤーの異なる)理論的規範を示すというワクワク感があったりします。

こういう理論的な「ワクワク感」にもっとフォーカスできれば良かったかもしれません。

傾向スコア法についての雑感

傾向スコア法の理解や使用において「Pearlの体系の知識は必要ない」と言われると、なんというか、「重回帰分析において偏微分の知識は必要ない」というセリフを聞いたときのようなモヤモヤをかんじるんですよね。いや、確かに、偏微分の知識がなくても重回帰分析はできますし、もしかしたら実際に重回帰ユーザーの大半は偏微分を分かってないかもしれないですが、いや、でも、さ、というような。

個人的な学習体験として、最初に星野さんの本を読んだ時には、傾向スコアの変数選択の部分については本当に天下り的に理解することしかできなかったんですよね。その後、Pearlの体系を学んでから星野さんの本の変数選択の部分を再読したら、いきなり「もう読んだ端から理解できる」という状態になってたんですよ。「傾向スコアとはバックドアに蓋をする合成変数である」という理解*1があると、もう本当に書いてあることがスルスルと(書いてあることがもう自明に感じて読んでいてもどかしさを感じるほどに)理解できるんですよね。

Rubin系の傾向スコアの説明だと、変数選択の部分は殆ど本質的にはempiricalな「How」の説明に終始しているのですが、Pearlの体系は変数選択に際して確固たる理論に基づくnormativeな「Why」の体系を提供してくれているんですよね。やっぱりnormativeな「Why」の部分も理解できていたほうが、(特に非典型的な例に遭遇した場合などに)強いのではないかと思います*2

傾向スコアの理解においてPearlの体系を学ぶことの効用の具体例としては、例えば、「強い無視可能性」の持つ本質的重要性を理解できることが挙げられるかと思います。どうしても、傾向スコアを最初に理解する際には、「傾向スコア←共変量」のモデリングの仕上がり具体の吟味に引きづられてしまうのですが(c統計量の値とか)、本来の「強い無視可能性」の意味を考えれば、実は「応答変数に効いているもの」を変数として選択することが重要なんですよね*3。この辺りは、グラフィカルモデル経由で傾向スコアの概念を理解したほうが分かりやすいように思います(参考:ハーバード白熱教室 これからの因果推論を考えよう)。

参考:吉田さん@Robins派の記事

*こちらに「因果推論祭り」を実際にご聴講いただいた方(吉田さん@Robins派)の感想もありますので合わせてどうぞ:
因果推論祭り、Tokyo.R、機械学習ハッカソンなどの話 - きのう何書いた?

大変ありがとうございます!>吉田さま

なにはともあれ

夏の因果推論祭りにお越しいただいた方、いただけなかった方も、大変ありがとうございました。

はてなブックマークの「学び」の欄が研究不正の話題で埋まっていたりする昨今にあり、純粋な学術的面白さを目当てに東大にお集まりいただいた方々に囲まれて幸せな時間を過ごせました。

今後とも何卒よろしくお願いいたします

参考文献

調査観察データの統計科学―因果推論・選択バイアス・データ融合 (シリーズ確率と情報の科学)

調査観察データの統計科学―因果推論・選択バイアス・データ融合 (シリーズ確率と情報の科学)

統計的因果推論 -モデル・推論・推測-

統計的因果推論 -モデル・推論・推測-

統計的因果推論―回帰分析の新しい枠組み (シリーズ・予測と発見の科学)

統計的因果推論―回帰分析の新しい枠組み (シリーズ・予測と発見の科学)

医学的介入の研究デザインと統計:ランダム化/非ランダム化研究から傾向スコア、操作変数法まで

医学的介入の研究デザインと統計:ランダム化/非ランダム化研究から傾向スコア、操作変数法まで

  • 作者: 木原雅子,木原正博
  • 出版社/メーカー: メディカルサイエンスインターナショナル
  • 発売日: 2013/10/31
  • メディア: 単行本(ソフトカバー)
  • この商品を含むブログを見る
*例えば↑の本なんかだと傾向スコアの変数選択のところは本当にempiricalな「How」しか書いてないんだよなあ...

*1:因果推論祭りの中で、この理解が適切であることを黒木さんに直接確かめることができました

*2:「因果推論」に関して言えば、Rubinの体系は「How」、Pearlの体系は「Why」についての体系であると感じています。なので、ハウツー的手法としてはRubinの方が洗練されていますが、「なぜそのHowが成り立つのか」を深く理解したければPearlの体系を学ぶのが近道であるように思います

*3:この点は星野本でも強調されているのですが、Pearlの体系を理解する以前は、天下り的にしか理解できませんでした