夏の因果推論祭りのフォローアップをこんなに遅れて書くつもりじゃなかった

こんにちは。フリッパーズ・ギターの性格が悪い方こと林岳彦です。

さて。

私も大人でありますので本業に追われることもままあります。そして追われているうちにすっかりご無沙汰してしまいました。はてはて。去る7/11に行われた因果推論祭りについてもブログにはまだ何も書いておりませんでした。申し訳ありませんでした。

まだ色々と余裕がないので、以下、雑感の書き散らしになりますがどうかご容赦を：

なにはともあれご講演をいただいた星野先生＆黒木先生に感謝しております

いや本当に感謝あるのみです。大変ありがとうございました。

そして聴講にお越しいただいた方々に感謝いたします

おかげさまで130人の教室がほぼ満員状態になるほどの方々にお越しいただけました。
大変ありがとうございました。

告知がネットやtwitterを中心に広まったこともあり、それぞれに面識も無くまた特に共通のバックグラウンドもない方々が集まり、普段の学会や勉強会とは何かしら異なる雰囲気でした。正直、登壇したときは、いつもより聴講者が「得体の知れない」気がして、近年になく緊張しました。（話をしているうちに和らぎましたが）

幾人か「中の人」にお会いできました

はてなブログ等でご活躍されている幾人かの「中の人」に直接ご挨拶することができました。
直接ご挨拶するのは照れくさいような面映いような、でも嬉しいものですね。
今後とも是非ともよろしくお願いいたします。

セミナーのレベル設定について

レベル設定は難しかったですね。聴講者のバックグラウンドも知識レベルも様々であり、レベル設定が高すぎて付いていけなかった方も、逆に低すぎて物足りなかった方もおられたかと思います。せっかく来ていただいたのに申し訳ない気持ちでいっぱいです。。（皆それぞれお忙しい中で貴重な時間を割いて来てくださっているわけで社交辞令ではなく本当に申し訳なく思っています）

「Pearl vs Rubin」という"アングル"について

私の告知文のせいで「Pearl vs Rubin」というアングルでの議論になりましたが、（人間的な部分でのエピソードの面白さはともかくとして）両者の理論のそもそものスコープの広がりを考えると、「Pearl vs Rubin」というのはあまり両理論の面白さのコアの部分を引き出すアングルではないのかもなあとも思いました（←今更）。

Rubinの潜在的結果変数の枠組みは、実解析において頻繁に直面する、欠測値等を含む「観測されなかったデータ」に対するアプローチとして非常にgeneralなリーチを持つという理論的なワクワク感があります。

一方、Pearlの枠組みは、これまた実解析において頻繁に直面する、（例えば）重回帰分析での変数選択において（AIC等とは全く理論的なレイヤーの異なる）理論的規範を示すというワクワク感があったりします。

こういう理論的な「ワクワク感」にもっとフォーカスできれば良かったかもしれません。

傾向スコア法についての雑感

傾向スコア法の理解や使用において「Pearlの体系の知識は必要ない」と言われると、なんというか、「重回帰分析において偏微分の知識は必要ない」というセリフを聞いたときのようなモヤモヤをかんじるんですよね。いや、確かに、偏微分の知識がなくても重回帰分析はできますし、もしかしたら実際に重回帰ユーザーの大半は偏微分を分かってないかもしれないですが、いや、でも、さ、というような。

個人的な学習体験として、最初に星野さんの本を読んだ時には、傾向スコアの変数選択の部分については本当に天下り的に理解することしかできなかったんですよね。その後、Pearlの体系を学んでから星野さんの本の変数選択の部分を再読したら、いきなり「もう読んだ端から理解できる」という状態になってたんですよ。「傾向スコアとはバックドアに蓋をする合成変数である」という理解*1があると、もう本当に書いてあることがスルスルと（書いてあることがもう自明に感じて読んでいてもどかしさを感じるほどに）理解できるんですよね。

Rubin系の傾向スコアの説明だと、変数選択の部分は殆ど本質的にはempiricalな「How」の説明に終始しているのですが、Pearlの体系は変数選択に際して確固たる理論に基づくnormativeな「Why」の体系を提供してくれているんですよね。やっぱりnormativeな「Why」の部分も理解できていたほうが、（特に非典型的な例に遭遇した場合などに）強いのではないかと思います*2。

傾向スコアの理解においてPearlの体系を学ぶことの効用の具体例としては、例えば、「強い無視可能性」の持つ本質的重要性を理解できることが挙げられるかと思います。どうしても、傾向スコアを最初に理解する際には、「傾向スコア←共変量」のモデリングの仕上がり具体の吟味に引きづられてしまうのですが（c統計量の値とか）、本来の「強い無視可能性」の意味を考えれば、実は「応答変数に効いているもの」を変数として選択することが重要なんですよね*3。この辺りは、グラフィカルモデル経由で傾向スコアの概念を理解したほうが分かりやすいように思います（参考：ハーバード白熱教室これからの因果推論を考えよう）。