Take a Risk:林岳彦の研究メモ

自らの研究に関連するエトセトラについてのメモ的ブログです。主にリスク学と統計学を扱っています。

8/6因果フェスのプレビュー:「系列Aと系列Bの関係は?」という問いに対する4つの素敵な解法について

こんにちは。林岳彦です。エ・レ・ファ・ン・ト・カ・シ・マ・シ(←滝川クリステル風に声に出して読みたい日本語)。


さて。

今回は8月6日に迫った日本生態学会関東地区会シンポジウム(a.k.a 因果フェス)についてのプレビューを書いてみたいと思います。

今回のシンポにおける問いを一言で言うと:「系列Aと系列Bはいかなる関係か?(*但し共変量および背景に関する情報は無いものとする*)」

統計的因果推論というと「介入効果/措置効果の推定」のことを思い浮かべる方も多いのかもしれませんが、そのテーマは昨年に扱いました

で、今年については本質的には以下の問いが中心になると言えるのかなと思います:

「系列Aと系列Bはいかなる関係かについて答えよ(*但し共変量および背景に関する情報は無いものとする*)」

はい。
これはシンプルではありますが非常に奥の深い問いです。

今回のシンポでは、この問いに対する4つの素敵な解法が紹介されることになります。


それぞれの解法を簡単にプレビューしてみます:


解法1:LinGAMによる解法
午後の部の最初の講演者である大阪大学の清水昌平さんからは、LiNGAM (Linear Non-Gaussian Acyclic Model)という手法を用いて因果が「A→B」なのか「A←B」なのかはたまた「因果関係なし」なのかを識別する方法を中心にお話いただきます。

この手法においては、非ガウス型の誤差分布により生じる非対称性を利用して因果関係が推定されます*1

*LiNGAMについての解説は以下でも見ることができますが、より詳しく知りたい方はぜひ本シンポにご来場いただければと思います。


解法2:Grangerの因果性テストによる解法
午後の部の2番目の講演者であるリクルートコミュニケーションズの尾崎隆さんからは、Grangerの因果性テストという手法を用いて2つの時系列データA, Bの間の"因果関係"を識別する方法についてお話いただきます。この手法においては、時系列間での相互予測力における非対称性を利用して"因果関係"が推定されます*2

(ここで"因果関係”とハイフン付きで書いているのは、ひとくちに”因果”といってもその意味内容には色々バリエーションがあるためです。その辺りの概念的な議論については午前の部において神戸大学の大塚さんに科学哲学の観点からご講義していただく予定です)

*Grangerの因果性テストの解説は以下でも見ることができますが、より詳しく知りたい方はぜひ本シンポにご来場いただければと思います。


解法3:Convergent cross mappingによる解法
午後の部の3番目の講演者である中央水産研究所の中山新一朗さんからは、Convergent cross mapping (CCM) という手法を用いて2つの時系列データA, Bの間の"因果関係"を識別する方法についてお話いただきます。この手法においては、非線形力学系に支配される原因系列と因果系列に含まれる情報量*3の非対称性を利用して"因果関係"が推定されます*4

上述のGrangerの因果性テストがstochasticな系の解析に適しているのに対し*5、CCMは決定論的な系の解析に適したものになっています。CCMは2012年にGeorge SugiharaらがScience誌で発表した比較的新しい手法であり、時系列因果推論におけるhotでsexyな解析手法として急速に広まっているようです*6

*Convergent cross mappingについての日本語の解説はまだ殆どないと思いますので、より詳しく知りたい方はぜひ本シンポにご来場いただければと思います。


解法4:MIC等による解法
最後の講演者であるALBERTの今井徹さんからは、AとBの間の非線形の関係性を捉える方法についてお話をいただきます。基本的には線形の世界において定義されているいわゆる「相関係数」というものを、非線形系も含めた一般的な概念としてどこまで拡張できる/推定できるのかというお話になるかと思います。

*今回のお話のプレビュー的なものを以下で見ることができますが、最新の話を含めてより詳しく知りたい方はぜひ本シンポにご来場いただければと思います。


はい。

というわけで以上4つの解法について簡単にプレビューをしてみました。
Grangerの因果テストとCCMは時系列データの解析手法であり、LiNGAMとMICは時系列に限らない一般のデータを対象とした解析手法となります。

ご興味のある方はこの機会を逃さずに是非ご来場いただければと思います。(非生態学会員の皆様もご遠慮せずにぜひどうぞ!)


では、8月6日の東大駒場キャンパス11号館におけるきっと素晴らしき可能世界にてお会いしましょう。


以下告知文の再掲:

当シンポの概要は以下のとおりです(生態学会関東地区会での正式告知はこちら):


生態学会関東地区会シンポジウム・公開シンポジウム
「非ガウス性/非線形性/非対称性からの因果推論手法:その使いどころ・原理・実装を学ぶ」


日時:2015年8月6日(木)10:20-17:50
会場:東京大学駒場キャンパス11号館 1101教室(11号館の地図駒場へのアクセス
主催:日本生態学会関東地区会 (link
企画者:林岳彦(国立環境研究所環境リスク研究センター)、津田真樹(テクノスデータサイエンス・マーケティング株式会社)
参加費:無料(事前申し込み不要)


プログラム

(1) 10:20-10:30
林 岳彦(国立環境研究所環境リスク研究センター)
「進化生態学者のための前口上:フィッシャー、ライト、因果推論」


(2) 10:30-11:30
大塚 淳(神戸大学大学院人文学研究科)(大塚さんのHP
「哲学から見た「因果」概念のレビュー」


[休憩1時間]


(3) 12:30-14:00
清水 昌平(大阪大学産業科学研究所)(清水さんのHP
「非ガウス性を利用した因果構造探索」


(4) 14:00-14:45
尾崎 隆(株式会社リクルートコミュニケーションズ)(尾崎さんのHP
「Granger因果による時系列データの因果推定」


[小休憩15分]


(5) 15:00-16:30
中山 新一朗(中央水産研究所)
「Convergent cross mapping の紹介と実践:決定論的力学系における因果関係推定」


(6) 16:30-17:15
今井 徹(ALBERT)(今井さんの記事
「非線形の関係を捉える各種指標(MIC等)について」


(7) 17:15-17:50
コメンテーター:黒木学(統計数理研究所)、久保拓弥(北海道大学)、伊庭幸人(統計数理研究所)
コメンテーターからのコメント&全体討論


問い合わせ先
林岳彦(hayashi.takehikoあっとまーくnies.go.jp)

  • 公開シンポジウムのため、どなたでもご聴講できます
  • 事前申し込み不要です(万が一会場が満杯になりましたら大変申し訳ありません)
  • 長丁場のため、個別のご講演のみのご聴講も歓迎いたします

*1:ちなみにRでもLiNGAMを実行できる関数が既に存在します

*2:という理解をしているのですが間違っていたらごめんなさい

*3:という言い方は適切でないかも?

*4:という理解をしているのですが間違っていたらごめんなさい

*5:間違っていたらごめん

*6:ちなみにRでもCCMを実行できるパッケージが既に存在します

確率概念について説明する(第3-2-1回):「可能性」と「確率」のあいだ/ 到達可能性の線引き問題

やっと会えたね(本能寺で)。林岳彦です。さいきんルンバを買いました。ルンバが動いているのを眺めるときに、「実はどこかで山本昌がこのルンバをラジコンで操作している」のだと想像しながらその動きを眺めるととても贅沢な気分になれます。おすすめのライフハックです。


さて。

確率概念についての記事については前編だけ書いて、1年以上も間が空いてしまいました。もう間男と呼ばれても仕方ありません。たいへん申し訳ありません。


前回(前編)では、「可能世界論からコルモゴロフの定理までを繋げる」話をしました。

今回(後編)では、前回の内容を踏まえて:

「可能である」という概念と「確率」概念のあいだのギャップ

について書いていきたいと思います。

(今回も長い記事になっております。本当にすみません。。)


前編のおさらいと補足:「様相論理と確率測度」の記事の追加

あまりにも間が空いてしまったので、まずは以下の前回記事を軽くおさらいしてみます。

確率概念について説明する(第3-1回):可能な世界の全体を1とする — コルモゴロフによる確率の定理(前編) - Take a Risk:林岳彦の研究メモ

前回のまとめは以下の通りでした:

  • 「可能である」ということは「(近傍の)可能世界全体の部分集合」の形で捉えることができる
  • 様相論理の理路から「確率空間」を捉えることがもし許容されるならば、以下のように「確率」を捉えることができる
  • ざっくり言うと:「Aの確率」とは、(近傍の)可能世界全体における「Aが真である可能世界の部分集合」の「大きさ」である
  • もうちょい細かく言うと:(近傍の)可能世界全体において、関数Pが以下の3つの要件を満たすとき、P(Aが真である近傍の可能世界の集合)は「Aの確率」である
    • 0 ≦ P(近傍の可能世界の部分集合)≦ 1
    • P(近傍の可能世界の全体)= 1
    • Aが真である近傍の可能世界の集合」と「Bが真である近傍の可能世界の集合」に重なりがないとき、P(Aが真である近傍の可能世界の集合 ∨ Bが真である近傍の可能世界の集合)= P(Aが真である近傍の可能世界の集合) + P(Bが真である近傍の可能世界の集合)

上記のまとめを読んでもさーせんしょうじきちんぷんかんぷんです、という方は適宜前回の記事および前々回の記事をお読みいただければと思います。


はい。

では今回の記事では、この「可能世界/様相論理から確率概念を捉える」アプローチに基づき、4つの論点を参照しながら「可能性と確率のあいだ」について見ていきたいと思います。

(厳格にアカデミックな内容というよりも、当面はリスク分析者による楽屋話のようなものになるかと思いますので、気楽に読んでいただければと思います)


*以下マニア向けの補足*
前回の記事を書いた後に、前回の記事と同様に「様相論理の理路から確率空間を捉える」というアプローチをしている記事を見つけたので以下に少し補足しておきます。

一つ目は、Stanford Encyclopedia of Philosophyの”Modal Probability Logics”の項になります。

”Modal probability logic”では、以下のように「様相論理 Modal Logic」と「確率 probability」を関連づけした論理が紹介されています*1

Modal probability logic makes use of many probability spaces, each associated with a possible world or state.

もう一つは、『Artificial intelligence』という本の「確率概念」の導入の項にありました。この本はクリエイティブ・コモンズなので以下から該当部が読めます:

Artificial Intelligence - foundations of computational agents -- 6.1.1 Semantics of Probability

上記では、確率概念と可能世界についてのっけから:

First we define probability as a measure on sets of worlds, then define probabilities on propositions, then on variables

と導入しており、本ブログの前回記事とほぼ同じ考え方になっています。

上記2つのサイトを見る限り、「可能世界/様相論理から確率概念を捉える」のは、ある程度一般性のあるアプローチと言えそうです。


(1)到達可能性の線引き問題:どこまでが「”近傍"の可能世界」なのか?

ではまずは、「到達可能性」の線引き問題を考えてみたいと思います。


前回の記事でのまとめでは「確率」概念について以下のように説明しました:

ざっくり言うと:「Aの確率」とは、この世界の近傍の可能世界全体における「Aが真である可能世界の部分集合」の「大きさ」である

この「説明」はもっともらしくはあるのですが、現実の問題を考える上では困ってしまうところもあります。

それはとりもなおさず:

「(近傍の)可能世界全体」というけれど、「近傍」ってどこまで含めるの?

という問題です。


ここでいちど用語法のおさらいをしておきましょう。「この世界の近傍の可能世界」というのは、「この現実世界@」から大きく隔たらないような(=この現実世界@から到達可能な)諸可能世界のことを意味しています。例えば、「ある朝に目を覚ましたときにあなたが巨大な虫になっている」ことが真である世界というのは、「この現実世界@」とは異なる物理法則や生物的法則が支配している世界であると考えられるため、「この現実世界@」の「近傍(=到達可能な)の可能世界」とは言えないでしょう。

では、どこまでの可能世界を『「この現実世界@」から大きく隔たらないような(=到達可能な)諸可能世界』として含めれば良いのでしょうか?

ここで私たちは、この世界から諸可能世界への「到達可能性」に関する線引き問題に直面します*2


先ずは単純な例として、コイン投げの結果に関する「可能世界」を考えてみましょう。

コイン投げの結果(落下後のコインの向き)は、普通に考えると”オモテ”か”ウラ"かということになります。ただし可能世界としては、「落下後のコイン向きが”ヨコ”(落下後にコインが立つ)」という可能世界も普通に想定することができます。

ここで、私たちは「コイン投げの結果が”ヨコ”である可能世界」を「この世界の近傍の(=到達可能な)」可能世界として含めるべきでしょうか?


現実的問題としては、コイン投げのケースについて確率的に考える場合には、「”ヨコ”なんて考えてらんねーよ」ということになるかと思います。

これは、私たちが私たちの世界における今までの経験に基づき、コイン投げに際しての確率的考察においては『「コイン投げの結果が”ヨコ”の可能世界」を「この世界の近傍の」可能世界として含めない』という判断を暗黙裡に行っていることを意味しています。

ここで注目してほしいのは、この判断自体の是非ではなく、現実世界における対象を扱う上では「この世界の近傍の可能世界の全体(=全事象)」を定めるために我々自身による何らかの判断(=”近傍"のdefine)が必要であるということです*3

そしてこの「近傍の(=到達可能な)可能世界の全体」の範囲が定まらないかぎりは「確率」は定義できません。対照的に、「可能性」という概念は「この世界の”近傍"の可能世界の全体」が定まらなくても成り立ちます。(例:Aが真の可能世界が少なくとも一つ存在する=Aの可能性がある)

ここに「可能性」という概念と「確率」という概念のあいだのギャップの一つがあるわけです。


この「どこまでを”近傍"に含めるのか問題」は、リスク分析の実務においてはしばしば現実的かつ本質的な問題になります。

例えば、「原子力発電所に重大事故を引き起こす外部的要因が生じる確率」を考える際に、「可能な外部的要因の事象」として何をどこまで考慮に含めるかという問題を考えてみましょう。

「大地震」「大津波」「大噴火」「旅客機の墜落」「ミサイル攻撃」「ドローンによる攻撃」「特殊部隊によるテロ攻撃」「隕石の落下」「超能力者の念力による攻撃」「宇宙人によるレーザー攻撃」等々、要因として生じる事象についてさまざまなレベルの「可能世界」を想定することができるかと思います。

これらの例において、「この世界の”近傍”の可能世界としてどこまでを考慮に入れるのか」というのは、絶対的な正解のないいわゆる「線引き問題」になります。


そして、実はリスク分析においてしばしば最も本質的*4な作業のひとつは、この「この世界の”近傍”の可能世界(=全事象)としてどこまでを考慮に入れるのか」というフレーミングの部分になります。

このフレーミングさえ終わってしまえばリスク分析に残るのはあとは単なるテクニカルなパズル解きだけである(≒ 計算機が充分に発達すればデータサイエンティストの手元に残るのはフレーム問題だけである)・・・というのは多少言い過ぎにしても、リスク分析の最終的なメッセージ自体がフレーミングの仕方に大きく左右されうるケースもあり、この部分はとても重要なものになるわけです。

・・・抽象的な話だと分かりにくいかもしれないので、少し例を出して考えていきます。


分析の結論(意思決定結果)がフレーミングの仕方に極端に依存するようなケースとして、地球温暖化対策についての意思決定において「マキシミン則」を適用する場合を考えてみましょう。

まず、マキシミン則について説明しておきます。Weblio辞書から引用(link)します:

マキシミンルール
意思決定理論の用語。不確実な状況のもとで,予想される最悪の事態を避けることを合理的とする行動決定の基準。ロールズが正義の原理を導出する際に用いたことで知られる。

はい。一般的にいうと、マキシミン則とは「最悪のケース(minimum)における効用」を「最大化(maximize)する」という意思決定規則になります。くだけた言い方をすると、最悪の事態をできるだけ「まし」なものにするという基準で意思決定を行うルールのことです。


さて。では可能世界の枠組みを用いて考えていきます。

地球温暖化問題において「最悪のケース(最悪の可能世界)」とは何でしょうか。私が考えを巡らした限りでは、地球温暖化の帰結における「最悪の可能世界」は、「人類が滅亡した世界」になるのかなと思います*5

ここで、マキシミン則を適用してみましょう。「人類が滅亡した世界」のケースは少なくとも人類にとっては効用の下限であると考えられる*6ので、「最悪のケース=人類が滅亡した世界」を防ぐためのいかなる方策もマキシミン則に拠れば「最悪のケースにおける効用を改善(=人類滅亡の回避」)」するという理由により正当化されることになります。つまり、マキシミン則によって考えれば、あらゆる地球温暖化対策はその効果がどんな微弱なものであっても正当化されることになるわけです。

ここでありうるツッコミとして、『そうはいっても「人類が滅亡した可能世界」に到達する”確率"なんて低いんじゃないの?』というものがあるかもしれません。

この辺りがポイントのひとつになります。

マキシミン則を採るかぎり、"確率"の大小は問題になりません。この世界の現在のありようが「人類が滅亡する可能世界の少なくとも一つに到達可能」であるかぎり、マキシミン則を採れば「人類が滅亡する」という極端なケースを判断基準とした意思決定の話に帰着することになります。

一方、もし温暖化による到達可能な最悪の可能世界を「シロクマが絶滅した世界」と規定した場合には、マキシミン則に基づき「温暖化なんて超巨額の資金を使って対策をするほどのものじゃないよね」ということになるかもしれません。


上記の事例が示しているのは、「マキシミン則による意思決定」は「可能世界の到達可能性の線引き(=”近傍”のフレーミング)」の仕方に決定的に依存しがちということです。

一般的に、ある「Xという行為」についての意思決定において「マキシミン則を採用」し、なおかつ「可能世界の到達可能性をかなり広く採る」と、「Xという行為」に関する効用の下限として「人類の滅亡」のような極端なケースが含まれてくるため、「Xという行為」についての絶対的な評価に繋がりがちになります。

例えば、有名な「パスカルの賭け(wikipedia)」というものがありますが、これは「神を信じるという行為」に対して「可能世界の到達可能性をかなり広く採る(=「地獄という可能世界」は到達可能であるとする)」ことにより「神を信じるという行為」の絶対的な評価へ至るロジックの一種として解釈できるかと思います。


(もう少し異なる方向からのツッコミとして、「地球温暖化対策を行なったことによりかえって「人類が滅亡した世界」へ至るような可能世界もあるんじゃないの?*7」とか「「人類が滅亡した世界」を可能世界に含むのは温暖化に限らないですよね?」とかいうものがありうるかとも思います。こういう観点を含めると、マキシミン則では決定不能なので何か他の原理を持ち込んで考えるしかないですよね、となってきます)


はい。上記の例では、リスク分析(に基づく意思決定)の文脈において、その結論がフレーミングの仕方に強く依存する場合があることを見てきました。(もしかして勘違いされている方もおられるかもしれませんが、「リスク分析という営み」そのものと、「どのような意思決定則を用いるか」は基本的には別個の問題ですのでご注意ください。例えば、シミュレーションによるリスク分析の結果を受けてマキシミン則を適用するというのも普通にありえる話です)

上記の例ではマキシミン則(効用の下限に基づく意思決定則)を考えているのでフレーミングに極端に依存しますが、例えば「平均効用」を用いてもフレーム内に極端な可能世界(効用が無限小であるとか)が含まれる場合には同じような状況が生まれます*8。一方、「効用の最頻値」を考えると状況は比較的ロバストになります。ここで、「どのような意思決定則を用いるべきか」は個別の文脈に応じて考えるべきであり、それ自体が大きな論点となるものです。


はい。


というわけで、本稿では「諸可能世界への到達可能性の線引き問題」という観点から『「可能性」と「確率」のあいだ』について見てきました。

このように、「可能性と確率のあいだ」についてどう考えるのかは、リスク分析においては実務的かつ本質的な問題として常に/既に横たわっているものなのです・・・とさらに書き続けていきたいところなのですが、もうずいぶん長くなってしまったのでこの続きは別エントリーとして書いていきたいと思います。


*次回は、『「この世界の確率の低さ」問題:あらゆる奇跡はありふれる』という論点について書いていきます。


*以下マニア向けの余談*
“確率"というものが「客観的」なものか「主観的」なものかという論点はしばしば論争の種になります。私自身は「確率とは間主観的概念である」という立場であり、確率概念についての「客観的確率」という捉え方については特にかなり否定的です。その理由は、私がベイジアンであるからというよりも、私がリスク分析の実務に関わる人間であるから、という側面の方が強いです。端的に言って、公共政策に関わるリスク分析においては「確率」が「客観的確率」である、という認識は殆どの場合において優良誤認に過ぎないように感じています*9。上で書いたように、そもそも公共政策におけるナマの問題群を「確率という概念の型」にどう押し込むかというところからして間主観的なフレーミングに依存する部分が大きいのです。そのため、私はリスク分析者としてのある種の規範的な感覚として、「客観的確率」というものを是認する気にはどうしてもなれないのです。(そして、リスク分析は ---公共政策における専門知による分析一般と同様に--- 「間主観的なもの」であるからこそ、合意、あるいは合意された手続、に基づくことが重要となるわけです)


参考文献

ワードマップ現代形而上学: 分析哲学が問う、人・因果・存在の謎

ワードマップ現代形而上学: 分析哲学が問う、人・因果・存在の謎

可能世界論も含めた形而上学の入門として。わたくし的には2014年に読んだ本の中でいちばん面白かったです。こういう本がたくさん出ると門外漢としてはとても嬉しいです。

可能世界の哲学―「存在」と「自己」を考える (NHKブックス)

可能世界の哲学―「存在」と「自己」を考える (NHKブックス)

可能世界論の入門として。

*1:ただし、上記引用からも分かるとおり、"Modal probability logic"は「一つの可能世界に対して一つの確率空間」を対応させているようなので、本ブログ前回の記事とは階層がひとつズレている話になっているようです。

*2:確率論のコトバで言いかえると、『「全事象」って、どこまで含めるの?』という問いに対応します

*3:その判断が意識的になされたものか否かに関わらず

*4:であるにもかかわらず日常実務的には軽視されがち

*5:異論は認めます

*6:異論は認めます

*7:ジオエンジニアリングとか

*8:「パスカルの賭け」は寧ろこっちに近いと考えるべきなのかもだけど、まあどっちでもいいかとも思います

*9:ただし、筆者の観測範囲にバイアスが存在する可能性あり

【因果フェス2015】8月6日@駒場:生態学会関東地区会シンポを企画させていただきました

こんにちは。林岳彦です。I’m not ABブラザーズ。


さて。

今年の8月6日(木)に日本生態学会関東地区会のシンポジウムを企画させていただくことになりました。ご講演者、コメンテーター、関東地区会幹事等々のご関係者のみなさま方に深くお礼を申し上げます。(その中でも、東京大学の嶋田正和先生には当シンポの企画に際して大変に親身なご助力をいただきました。改めて感謝申し上げます。)

当シンポの概要は以下のとおりです(生態学会関東地区会での正式告知はこちら):

生態学会関東地区会シンポジウム・公開シンポジウム
「非ガウス性/非線形性/非対称性からの因果推論手法:その使いどころ・原理・実装を学ぶ」


日時:2015年8月6日(木)10:20-17:50
会場:東京大学駒場キャンパス11号館 1101教室(11号館の地図駒場へのアクセス
主催:日本生態学会関東地区会 (link
企画者:林岳彦(国立環境研究所環境リスク研究センター)、津田真樹(テクノスデータサイエンス・マーケティング株式会社)
参加費:無料(事前申し込み不要)


プログラム

(1) 10:20-10:30
林 岳彦(国立環境研究所環境リスク研究センター)
「進化生態学者のための前口上:フィッシャー、ライト、因果推論」


(2) 10:30-11:30
大塚 淳(神戸大学大学院人文学研究科)(大塚さんのHP
「哲学から見た「因果」概念のレビュー」


[休憩1時間]


(3) 12:30-14:00
清水 昌平(大阪大学産業科学研究所)(清水さんのHP
「非ガウス性を利用した因果構造探索」


(4) 14:00-14:45
尾崎 隆(株式会社リクルートコミュニケーションズ)(尾崎さんのHP
「Granger因果による時系列データの因果推定」


[小休憩15分]


(5) 15:00-16:30
中山 新一朗(中央水産研究所)
「Convergent cross mapping の紹介と実践:決定論的力学系における因果関係推定」


(6) 16:30-17:15
今井 徹(ALBERT)(今井さんの記事
「非線形の関係を捉える各種指標(MIC等)について」


(7) 17:15-17:50
コメンテーター:黒木学(統計数理研究所)、久保拓弥(北海道大学)、伊庭幸人(統計数理研究所)
コメンテーターからのコメント&全体討論


問い合わせ先

林岳彦(hayashi.takehikoあっとまーくnies.go.jp)

  • 公開シンポジウムのため、どなたでもご聴講できます
  • 事前申し込み不要です(万が一会場が満杯になりましたら大変申し訳ありません)
  • 長丁場のため、個別のご講演のみのご聴講も歓迎いたします
  • オラわくわくしてきたぞ


何卒よろしくお願いいたします!

僕は論文が書けない:苦境脱出へ向けての2+1冊

こんにちは。林岳彦です。最近は佐野元春ばかり聴いています*1。将来的にはあんな髪型になりたい。


さて。

「研究者なれども研究しない!」という斬新な決めフレーズでおなじみの雑用戦隊ヒーローシリーズがありますが、かくいう私も何やかんやの雑用に埋もれてここのところ論文を書くペースがすっかり落ち込んでおり*2、そんなこんなのアオリで本ブログも休止しているありさまになっています。

そんな折、私の心の師ともいうべき東北大学の酒井聡樹先生から近刊である『これから論文を書く若者のために 究極の大改訂版』をご恵贈いただいたので今回の記事を書くことにしました。

これから論文を書く若者のために 究極の大改訂版

これから論文を書く若者のために 究極の大改訂版

今回は、久しぶりの【研究hacks】タグの記事になります。今回は院生〜若手〜中堅研究者くらいの方々を想定読者として書いていきます。

(書いてるうちにまたかなり長くなってしまいました。すみません。。。)


論文が書けない それは苦しい

はい。ではまず手始めに事実を確認しておきましょう。論文が書けない。それは苦しいことです。

「飛べない豚はただの豚」という有名なフレーズがありますが、「書けない研究者はただの金髪豚野郎ヒト」であるように思います。

どんなに些細な研究であったとしても、その内容を論文として遺すことにより私たちの研究ははじめてパブリックなものになり、その一つ一つはささやかなものであるかもしれない論文たちが集積しアカデミズムという大河へと連なり人類の学究は悠久の時を超えて続いていくのです。

個々の研究者というものはアカデミズムという大河に浮かぶ一隻の小舟のようなものです。そして言わば「論文が書けない研究者」はこの大河から外れて座礁してしまった存在なのです。もし我々が「論文が書けない」状況に陥ってしまったならば、そしてもし依然「研究者」でありつづけたいのならば、急いでまたその大河へと戻らねばなりません。


どうやって戻るのかって?

論文を書くのです。他に道はありません。

1冊めの紹介:『これから論文を書く若者のために 究極の大改訂版』

はい。では論文を書くための(再)準備を進めていきましょう。

まずは酒井先生からご恵贈いただいた『これから論文を書く若者のために 究極の大改訂版』を採り上げていきます。

(いちおう情報開示のため酒井先生と私の関係性を説明しておきますと、私と酒井先生は15年ほど昔に「大学院生(私)と、私の指導教官(某河田雅圭先生)と仲の良い助教授(酒井先生)」という関係でした。比喩的に言えば、私にとって河田先生が「ダメな親*3」ならば酒井先生は「気さくな叔父さん」というイメージです。私にとってとてもありがたい存在でした)

これから論文を書く若者のために 究極の大改訂版

これから論文を書く若者のために 究極の大改訂版

*酒井先生自身による本書の紹介ページはこちら


さて。「人生で必要な知恵はすべて大学院の修羅場で失った幼稚園の砂場で学んだ」という有名なフレーズがありますが、私にとって本書は「論文書きに必要な知恵はすべてこの本で学んだ」と言っても過言ではない本です。マジ感謝しております。

もしかすると訝しんでおられる方も居るかもしれませんが、決して単に今回ご恵贈いただいたという理由により本書の宣伝をしているわけではありません。私の本書にかける想いはそんなインスタントなものではありません。以下のリンク先に確固たる証拠があります:

Amazon.co.jp:カスタマーレビュー: これから論文を書く若者のために


実は、上記のリンク先にある本書の初版についての『類をみない良書』という題のアマゾンレビューは、私が11年前にテネシー大学でのポスドク時代に書いたものなのです*4。いま改めてこのレビューを読み返すと、私の本書へのほとばしる愛と、元指導教官(某河田先生)へのにじみ出る恨み節が感じられて、我ながらほっこりといたします。


上記の11年前のアマゾンレビューでも書いていますが、「論文を書くスキル」というものは論文を書くことでしか養われない部分があります。多くの場合、筆頭著者で4本、5本、6本と論文を書いていくとだんだん「ああ俺もかなり論文を書くスキルがついたなあ」と思えてくるのではないでしょうか。問題は、では「はじめて論文を書く若者」はどうすれば良いのか、ということになります。

本書はそんな「はじめて論文を書く若者」のために最初の手ほどきをしてくれる稀有な本なのです。


はじめて論文を書く若者は色々なことが分かりません。

イントロダクションをどう書けば良いのかが分からない、メソッドには何をどこまで書けば良いのかが分からない、リザルトには何を書き何を書くべきでないのかが分からない、ディスカッションには何をどう書いていいのかわからない、投稿時のレターには何を書けば良いのかわからない、査読コメントのリプライはどのように書けば良いのか分からない、リジェクトのレターが届いたときにどんな顔をすれば良いのか分からない、など分からないことだらけです。


本書はそんな「(科学)論文の執筆から受理に至るまでの過程において何を書くべきであり何を書くべきではないのか」について丁寧に語ってくれる大変ありがたい本なのです。

「論文の書き方が分からない」という若者の方々、あるいはそのような若者を指導する立場になった研究者の方々には、まず読むべき本として心からオススメしたいと思います。


論文書きという苦境の中に、仄かに希望の光が見えてくる、かもしれません。


2冊めの紹介:『できる研究者の論文生産術 どうすれば「たくさん」書けるのか』

さて。

基本的にポイズンなこの世の中では、残念ながら、論文の書き方は分かっていても論文が書けない状況に陥ることもあります。

「研究者がバスルームで論文を書くのを邪魔をする100の方法」というロリポップ・ソニック改名バンドの有名な曲がありますが、研究者も中堅にさしかかってくると、さまざまな書類書きや会議や教育や学会業務や愛しさや切なさや心強さなどによって、そもそも「研究をする時間/論文を書く時間がない!」という新たな壁にぶち当たるようになります。

その壁をどう乗り越えるのか。その戦略を考える際に参考になるのが、以下の『できる研究者の論文生産術 どうすれば「たくさん」書けるのか』です。

できる研究者の論文生産術 どうすれば「たくさん」書けるのか (KS科学一般書)

できる研究者の論文生産術 どうすれば「たくさん」書けるのか (KS科学一般書)

*出版社による本書の紹介ページはこちら


この本の内容は、本書のはじめに収録されている三中信宏さんによる「推薦のことば:日本語版刊行にあたって」の中で以下のように巧みに要約されてます*5

 本書が掲げるのはたくさん書くための抽象的な精神論ではない。むしろ、この上もなく具体的な行動規範を著者は強調する。とくに重要な点は、文章を書くための時間は”見つける”ものではなく、スケジュール的に”割り振る”という発想の転換である。書く時間をあらかじめ設定し、万難を排してそのスケジュールを死守する書き手を著者は「スケジュール派(schedule-follower)」と呼ぶ。たくさん書くためにはスケジュール派であれ。たしかにこのスローガンを守ることができる研究者はきっとシアワセになれる。ウソではない。

 日頃よく耳にする「もっと時間があったら…」とか「機が熟してから…」とか「もっと調べてから…」という弁解は、単に自分が書かないことに対する見苦しい言い訳にすぎない。ヒソカに罪の意識に苛まれつつ、それでも書くことを先延ばしにしたあげく、締切間際まで追い込まれてからドロナワ夜なべ仕事で書きまくるスタイルを著者は嘲笑して「一気書き(big writing)」と呼ぶ。研究者が「一気書き」に逃避するこのような言い訳を、著者がひとつひとつ論破していくようすはまさに大魔神のごとし。

はい。このような本です。

本書は、日々の多忙さの只中で「書くためのスケジュールをどう確保する(べき)か」という問題について、心理学者である著者が専門的な知見を交えつつ解決策を説いていく本です。その筆致は説得的かつスムーズであり、文章を楽しみながら「書くための時間をあらかじめ確保すること」の大切さとそのための具体的な方法を学べるようになっています。


もしかすると、本書の副題の『どうすれば「たくさん」書けるのか』という部分に対して、「研究者の目指すべきは論文のじゃねーだろーが」と反発を覚える方もいるかもしれません。しかし、実際に読んでみると『「たくさん」書ける』というのは釣りタイトルに近いことが分かります。著者自身が本書のおわりで述べている箇所を引用します*6

本書で説明しているのは、たしかに「どうやって文章をたくさん書くか」かもしれない。でも、たくさん書かねばならないというふうに思い込まないこと。正確を期すということでは、本書のタイトルは『どうやって通常の勤務日に、不安や罪悪感に苛まれずに、より生産的に書くか』にした方がよかったのかもしれない。でも、それでは誰も買ってくれないだろう。

確かに、本書の内容をより正確に表すと『通常の勤務日に、不安や罪悪感に苛まれずに、より生産的に書く方法』になるかと思います。なので、「たくさん書く」の部分に反発を感じた方もご安心ください。


というわけで、寄せては返す雑用の波に揉まれながらも『通常の勤務日に、不安や罪悪感に苛まれずに、より生産的に書きたい』という儚い望みを持ちつづけて日々耐え忍んでいる愛すべき研究者の方々に、本書をオススメしたいと思います。

ちなみに三中信宏さんはこの本に書いてあることを実践したら、なんと1年近く放っておいた翻訳のお仕事がみるみるうちに『たった三週間でまる一冊が翻訳できてしまった』そうですよ。むかしジャンプに載ってたブルワーカーの広告みたいに凄い効果ですね!

+1冊の紹介:『かくかくしかじか』

さてさて。

もちろん、基本的にポイズンなこの世の中では、上記の『できる研究者の論文生産術』を読んだからといって、そもそもの雑用の総量が減るわけではありません。たとえどんなに雑用を減らそうと努力したとしても、エントロピーと雑用が増大しつづけるというのは、宇宙の法則なのです。島本和彦作品の登場人物でもないかぎり、一介の個人が宇宙の法則に勝てるはずがありません。

「研究者が論文を書き始めれば7人の敵がいる、もしくは、11人いる!」という有名なフレーズがありますが、職場の状況によっては、もろもろの雑用による組織への貢献で認められていれば、いつの間にか周りから「論文を書け」と強くは言われなくなってくるかもしれません。研究者も中堅にさしかかると、毎日毎日、何だかんだで雑用を強気で注文してくる人々の数はとても多くなるものですが、それに比べると「論文を書け」と強気で注文をしてくる人の数はとても少なくなっていくものです。

そんな状況の中で、雑用の波に流されずに「論文を書く」ことに情熱と時間を割きつづけることは簡単ではないのかもしれません。

しかし。想像してみてください。

もし、今あなたが後ろに振り向いたらそこに佐野元春が居て、その佐野元春に「きみは雑用がしたくて研究者になったのかい?」と正面から尋ねられたら、あなたは何と答えますか?

「研究です!私は研究がやりたいんです!」と涙ながらに答えるのではないでしょうか。少なくとも私はそう答えるでしょう。研究がやりたいのです。佐野元春相手に嘘はつけません。

しかし、現実とは基本的にポイズンなものです。
現実には、あなたの後ろの正面に佐野元春はいないのです。
現実には研究者も中堅に差し掛かってくると、佐野元春どころか、「論文を書け」と背中を押してくれる人間自体がもう周りからいなくなってくるのです。

寂しいことです。

そんな状況の中堅研究者にオススメしたい作品が、東村アキコさんの『かくかくしかじか』という作品です:

かくかくしかじか 5 (愛蔵版コミックス)

かくかくしかじか 5 (愛蔵版コミックス)

*出版社による本作品の紹介ページはこちら
*本作品についての東村アキコさんのインタビューはこちら


この本は「マンガ大賞2015」も受賞しているたいへん有名なマンガなので、既にご存知の方も多いかと思います。この漫画は、作者である東村アキコさんと、彼女の高校からの絵の師匠である日高先生との関係を描いた自伝的作品です。


もしあなたが中堅研究者であるならば、ぜひこのマンガを読んでみてください。

この『かくかくしかじか』を読み通すと、おそらく、あなたがまだ「これから論文を書く若者」だった頃から研究者として独り立ちするまでに、論文を『書け』とあなたの背中を押してくれた指導教官、大学院の先輩、あるいは色々と世話をしてくれた年長の研究者などなどの顔が思い浮かんでくるのではないかと思います。

そして、もしかしたら、本作品内でのアキコのように、今までそんな方々に不義理を重ねてきたことを思いだして心がしくしくと痛むのかもしれません。


そうならば、今からせめてもの「恩返し」をしましょう。

どう恩返しするのかって?


論文を書くのです。私たちは研究者なのですから。


おわりに:「いつ書くの?」

はい。

今回は以下の3冊(というか2冊と1シリーズですが)の本を紹介いたしました。

これから論文を書く若者のために 究極の大改訂版

これから論文を書く若者のために 究極の大改訂版

できる研究者の論文生産術 どうすれば「たくさん」書けるのか (KS科学一般書)

できる研究者の論文生産術 どうすれば「たくさん」書けるのか (KS科学一般書)

かくかくしかじか 5 (愛蔵版コミックス)

かくかくしかじか 5 (愛蔵版コミックス)

もし上記の3冊(というか2冊と1シリーズ)を読み終えれば、論文を書くための技術も、論文を書くための時間を確保するための段取り法も、論文を書くためのモチベーションも、全てが準備万端となるはずです。


あとは書き始めるだけです。

想像してみてください。


もし佐野元春に「きみはいつ論文を書き始めるんだい?」と尋ねられたら、あなたはどう答えますか?




もちろん答えは・・








SOMEDAY

SOMEDAY









.*7

*1:さいきん『Visitors』のころのライブ映像を見ました。『Visitors』ってヒップホップの印象が強かったですが、ライブ映像を見るとむしろプリンスの影響を強くかんじるなあと思いました。今さらながら意外な発見

*2:もともとペース低いのに、さらに

*3:当時の河田先生はかなりの放置系の先生で院生としては非常に苦しみました。今は元学生として普通に仲良くさせていただいていますが、今でも河田先生に「林君は昔は暗かったけど今は明るくなったね」とか言われると、「院生時代はお前のせいで暗かったんじゃ〜!!」とふつふつと当時の恨みがよみがえります。あと関係ないけどおぎやはぎの矢作さんは河田先生にちょっと似てると思う

*4:昔はアマゾンレビューをけっこう書いたりしてました。今考えるとそんな暇あったら論文書け!っていう話ですね。

*5:同書内頁viiより引用

*6:同書内頁155より引用

*7:すんません。嘘です。。。今日から書き始めましょう!

業務連絡:当面のあいだ更新止まります

こんにちは。林岳彦です。プロレタリア白菜。

すっかりdutyの多重債務状態になりにっちもさっちもアームストロングなので、本ブログおよびtwitterとブクマも当面のあいだ(少なくとも半年以上は)更新止まります。


敬愛する某コロンさんよりは早く帰ってきたいです。

夏の因果推論祭りのフォローアップをこんなに遅れて書くつもりじゃなかった

こんにちは。フリッパーズ・ギターの性格が悪い方こと林岳彦です。

さて。

私も大人でありますので本業に追われることもままあります。そして追われているうちにすっかりご無沙汰してしまいました。はてはて。去る7/11に行われた因果推論祭りについてもブログにはまだ何も書いておりませんでした。申し訳ありませんでした。

まだ色々と余裕がないので、以下、雑感の書き散らしになりますがどうかご容赦を:

なにはともあれご講演をいただいた星野先生&黒木先生に感謝しております

いや本当に感謝あるのみです。大変ありがとうございました。

そして聴講にお越しいただいた方々に感謝いたします

おかげさまで130人の教室がほぼ満員状態になるほどの方々にお越しいただけました。
大変ありがとうございました。

告知がネットやtwitterを中心に広まったこともあり、それぞれに面識も無くまた特に共通のバックグラウンドもない方々が集まり、普段の学会や勉強会とは何かしら異なる雰囲気でした。正直、登壇したときは、いつもより聴講者が「得体の知れない」気がして、近年になく緊張しました。(話をしているうちに和らぎましたが)

幾人か「中の人」にお会いできました

はてなブログ等でご活躍されている幾人かの「中の人」に直接ご挨拶することができました。
直接ご挨拶するのは照れくさいような面映いような、でも嬉しいものですね。
今後とも是非ともよろしくお願いいたします。

セミナーのレベル設定について

レベル設定は難しかったですね。聴講者のバックグラウンドも知識レベルも様々であり、レベル設定が高すぎて付いていけなかった方も、逆に低すぎて物足りなかった方もおられたかと思います。せっかく来ていただいたのに申し訳ない気持ちでいっぱいです。。(皆それぞれお忙しい中で貴重な時間を割いて来てくださっているわけで社交辞令ではなく本当に申し訳なく思っています)

「Pearl vs Rubin」という"アングル"について

私の告知文のせいで「Pearl vs Rubin」というアングルでの議論になりましたが、(人間的な部分でのエピソードの面白さはともかくとして)両者の理論のそもそものスコープの広がりを考えると、「Pearl vs Rubin」というのはあまり両理論の面白さのコアの部分を引き出すアングルではないのかもなあとも思いました(←今更)。

Rubinの潜在的結果変数の枠組みは、実解析において頻繁に直面する、欠測値等を含む「観測されなかったデータ」に対するアプローチとして非常にgeneralなリーチを持つという理論的なワクワク感があります。

一方、Pearlの枠組みは、これまた実解析において頻繁に直面する、(例えば)重回帰分析での変数選択において(AIC等とは全く理論的なレイヤーの異なる)理論的規範を示すというワクワク感があったりします。

こういう理論的な「ワクワク感」にもっとフォーカスできれば良かったかもしれません。

傾向スコア法についての雑感

傾向スコア法の理解や使用において「Pearlの体系の知識は必要ない」と言われると、なんというか、「重回帰分析において偏微分の知識は必要ない」というセリフを聞いたときのようなモヤモヤをかんじるんですよね。いや、確かに、偏微分の知識がなくても重回帰分析はできますし、もしかしたら実際に重回帰ユーザーの大半は偏微分を分かってないかもしれないですが、いや、でも、さ、というような。

個人的な学習体験として、最初に星野さんの本を読んだ時には、傾向スコアの変数選択の部分については本当に天下り的に理解することしかできなかったんですよね。その後、Pearlの体系を学んでから星野さんの本の変数選択の部分を再読したら、いきなり「もう読んだ端から理解できる」という状態になってたんですよ。「傾向スコアとはバックドアに蓋をする合成変数である」という理解*1があると、もう本当に書いてあることがスルスルと(書いてあることがもう自明に感じて読んでいてもどかしさを感じるほどに)理解できるんですよね。

Rubin系の傾向スコアの説明だと、変数選択の部分は殆ど本質的にはempiricalな「How」の説明に終始しているのですが、Pearlの体系は変数選択に際して確固たる理論に基づくnormativeな「Why」の体系を提供してくれているんですよね。やっぱりnormativeな「Why」の部分も理解できていたほうが、(特に非典型的な例に遭遇した場合などに)強いのではないかと思います*2

傾向スコアの理解においてPearlの体系を学ぶことの効用の具体例としては、例えば、「強い無視可能性」の持つ本質的重要性を理解できることが挙げられるかと思います。どうしても、傾向スコアを最初に理解する際には、「傾向スコア←共変量」のモデリングの仕上がり具体の吟味に引きづられてしまうのですが(c統計量の値とか)、本来の「強い無視可能性」の意味を考えれば、実は「応答変数に効いているもの」を変数として選択することが重要なんですよね*3。この辺りは、グラフィカルモデル経由で傾向スコアの概念を理解したほうが分かりやすいように思います(参考:ハーバード白熱教室 これからの因果推論を考えよう)。

参考:吉田さん@Robins派の記事

*こちらに「因果推論祭り」を実際にご聴講いただいた方(吉田さん@Robins派)の感想もありますので合わせてどうぞ:
因果推論祭り、Tokyo.R、機械学習ハッカソンなどの話 - きのう何書いた?

大変ありがとうございます!>吉田さま

なにはともあれ

夏の因果推論祭りにお越しいただいた方、いただけなかった方も、大変ありがとうございました。

はてなブックマークの「学び」の欄が研究不正の話題で埋まっていたりする昨今にあり、純粋な学術的面白さを目当てに東大にお集まりいただいた方々に囲まれて幸せな時間を過ごせました。

今後とも何卒よろしくお願いいたします

参考文献

調査観察データの統計科学―因果推論・選択バイアス・データ融合 (シリーズ確率と情報の科学)

調査観察データの統計科学―因果推論・選択バイアス・データ融合 (シリーズ確率と情報の科学)

統計的因果推論 -モデル・推論・推測-

統計的因果推論 -モデル・推論・推測-

統計的因果推論―回帰分析の新しい枠組み (シリーズ・予測と発見の科学)

統計的因果推論―回帰分析の新しい枠組み (シリーズ・予測と発見の科学)

医学的介入の研究デザインと統計:ランダム化/非ランダム化研究から傾向スコア、操作変数法まで

医学的介入の研究デザインと統計:ランダム化/非ランダム化研究から傾向スコア、操作変数法まで

  • 作者: 木原雅子,木原正博
  • 出版社/メーカー: メディカルサイエンスインターナショナル
  • 発売日: 2013/10/31
  • メディア: 単行本(ソフトカバー)
  • この商品を含むブログを見る
*例えば↑の本なんかだと傾向スコアの変数選択のところは本当にempiricalな「How」しか書いてないんだよなあ...

*1:因果推論祭りの中で、この理解が適切であることを黒木さんに直接確かめることができました

*2:「因果推論」に関して言えば、Rubinの体系は「How」、Pearlの体系は「Why」についての体系であると感じています。なので、ハウツー的手法としてはRubinの方が洗練されていますが、「なぜそのHowが成り立つのか」を深く理解したければPearlの体系を学ぶのが近道であるように思います

*3:この点は星野本でも強調されているのですが、Pearlの体系を理解する以前は、天下り的にしか理解できませんでした

識別/生成モデルの観点から見たRubin/Pearlの統計的因果推論(*既に一定の予備知識のある方向け)

こんにちは。林岳彦です。ついに夏の統計的因果推論祭りが今週の木曜(7/10)に迫ってきました!

ちゃんと予定どおり開催されますので、参加申し込みをされたみなさま、台風に負けずにご来場いただければ幸いでございます。

さてさて。


この祭りに備えてさいきん改めて統計的因果推論の辺りを復習しているのですが、今回は自分のためのメモとして「識別/生成モデルの観点から見たRubin/Pearlの統計的因果推論」について書いてみたいと思います。(ひじょうにマニアックな内容になります)


(今回の記事は「統計的因果推論」に対して既に一定の予備知識がある読者を想定して書いていきますので、多くの方々には意味不明なものになるかもしれませんが大変申し訳ありません)

前置き:今回の元ネタとなる2つの記事の紹介

そもそものことを言いますと、今回の記事は以下の2つの記事にかなり直接的にインスパイアされて書かれたものです。なので、以下の記事をご一読の上でこの記事を読んだほうが、本記事が「そもそもどういうことを考えて書かれたのか」が分かりやすいかと思われます*1

(1)の伊庭さんの論文は、ベイズ統計の流行について「識別モデルと生成モデル」という観点から論じたものです*2

(2)の筒井さんの記事は、社会学における「”因果効果”の推定(措置効果モデル系)」と「媒介による説明(回帰分析系)」を巡る変遷について書かれたものです。

今回の記事では、(1)の論文の「識別モデルと生成モデル」という観点から、(2)の記事の「因果効果の推定 vs 媒介による説明」というテーマについて書いていきます。

まずは用語説明:生成モデル・識別モデルとは?

では、まずは「識別モデル(discriminative model)」と「生成モデル(generative model)」という用語について見ていきます。

「識別/生成モデル」という語に関しては、人によってやや用法に幅があるようですが、まず上記の伊庭(2006)における説明を引用してみます(尚、本論文中では"discriminative model”の訳語として「判別モデル」という語が使われています)

すでに述べたように、生成モデル(generative model)の考え方では、データの生成過程を条件付き確率で表現して、すべての変数の同時分布を書き下し、あとは必要に応じてベイズの公式を使う、というのが基本的な方針である。これに対して、与えられた目的に必要な条件付き確率のみを抜きだしてモデル化する考え方がある。ここでは、これを判別モデル(discriminative model)と呼ぶことにする。


この2つはあくまでもモデル化の上での相対的な方針であって「これが生成モデルで、これは判別モデル」といった絶対的な判断基準があるわけではない。むしろ、生成的なモデル化(generative modeling)と判別的なモデル化(discriminative modeling)のように「方針」としてとらえたほうがよいかもしれない。また、統計的情報処理の目的は「判別」ばかりではないので、一般には「判別的なモデル化」というより「部分的なモデル化」ということになる。


対立点をまとめると

生成モデル
全体をモデル化して、目的に応じてそれを変形して利用する。変形のためにベイズの公式を積極的に利用。
判別モデル
必要のない部分はモデル化しない。ベイズの公式はなるべく使わない。

ということになる。これは「ベイズ」と「非ベイズ」の古典的対立のエッセンスを抜き出したものにも見えるが、二項対立ではなく多数のモデルを整理する軸として提示されている点にちがいがあるし、内容的にもより幅が広くなっている。

はい。ニュアンスも伝わる良い説明だと思います(あやかりたいものです)。(当該論文が入手可能な方は面白いのでぜひ全文をご一読ください!)

一応もういちど地の文でもまとめると:

基本的には(広義には)、「先ずデータの生成プロセスをモデリングする」のを志向するのが「生成的なモデル化」「生成プロセスをすっとばして所与のデータから直接問題を解く」のを志向するのが「判別的(識別的)なモデル化」という言い方ができそうです。

また、実践的には、前者は「生成プロセスを条件付き確率の形で記述→記述さえできれば後は変形してベイズで(さくっとあるいはゴリゴリと)モデルパラメータの計算」という形で、後者は「所与のデータ→基底関数を噛ます→直接問題を解く(問題を解く能力を最大化するようにパラメータを学習させる)」という形で解かれることが多いようです。


どちらのアプローチが良いかというのはケースバイケースとしか言いようがないとは思いますが、(識別/分類そのものが目的である場合の)一般論としては、データ生成プロセスが適切にモデル化可能な場合には生成モデルの方が良いものの、それ以外のケースでは識別モデルの方が良い、と言えるかと思います。


また、一般論として、生成モデルの難点の一つは『生成過程からのモデル化ということを徹底すると、いわば「世界全体」を生成する」ことになってしまい、大変なことになる』(上記の伊庭 2006 から引用)という面も挙げられるかもしれません。この世界の生成プロセスーーー因果の継起ーーーにはアプリオリなキリはないからです。

後述するように、Rubinの体系もPearlの体系も着眼点は違えど「生成過程からのモデル化」に基づく体系として考えることができます。以下では、それらの体系の中で「世界全体を生成せずに済ませる」ための手法として、「傾向スコア」や「バックドア基準」というものを捉えてみたいと思います。

識別/生成モデルの枠組みから見たRubinの統計的因果推論と傾向スコア

はい。では、識別/生成モデルの枠組みからRubinの統計的因果推論の枠組みを眺めてみたいと思います。

調査観察データの統計科学―因果推論・選択バイアス・データ融合 (シリーズ確率と情報の科学)

調査観察データの統計科学―因果推論・選択バイアス・データ融合 (シリーズ確率と情報の科学)

上記の星野さんの本を読む限りでは、Rubinの枠組みは基本的には「潜在的結果変数/欠測値に関する生成モデル的アプローチ」に基づく体系であるように思われます。このアプローチの中で、「欠測データ」の生成プロセスや「反事実的データ(潜在的結果変数)」の生成プロセスを「条件付き確率の形」で全て記述することさえできれば、原理的には後はベイズで計算することができます。

しかしながら、それらの生成プロセスは多くの場合に複雑and/or不明瞭であり、条件付き確率の形で書き切ることは困難です。また、複雑なモデルになると、原理的にはベイズで計算できるとはいってもその実行はなかなか大変になってきます。

そこで、問題の単純化への「抜け道」として良く用いられているのが「傾向スコア」になります。

はい。で、この「傾向スコア」のアプローチは事実上、「条件の”割付"に関する部分を識別的モデル*3で置き換える」ものとして捉えることができるかと思います。

実際に、「傾向スコア」の有用性/汎用性というのは、一般論として「識別モデル」が持つ有用性/汎用性とほぼ重なる部分が多く、共変量と割付に関連する部分の「生成モデル」がよく分からない場合においてもその辺りは全部すっとばしてロバストな推定をもたらしてくれたりするわけです。

(一方、実務上で少し困るところは「傾向スコア算出のための良い(実用に足る)”識別モデル"が得られるかどうかは実際にデータを喰わせて”学習"させてみないと分からない」ところかもしれません。「適切な生成モデルが構築できるか否か」という見通しの方は事前知識から割りと立ちやすい気もするのですが、「良い"識別モデル"が得られるか否か」というのは、実際にやってみないと事前には見通しが立たない面が大きいように思います。これはつまり、例えば、競争的研究資金の申請時などに、「これからデータを集めて、傾向スコアで分析やります!」とまるっと書いてしまうと多少リスキーな面があるということです)


識別/生成モデルの枠組みから見たPearlの統計的因果推論とバックドア基準

さて。次は、Pearlの統計的因果推論の枠組みを眺めてみたいと思います。

統計的因果推論 -モデル・推論・推測-

統計的因果推論 -モデル・推論・推測-

統計的因果推論―回帰分析の新しい枠組み (シリーズ・予測と発見の科学)

統計的因果推論―回帰分析の新しい枠組み (シリーズ・予測と発見の科学)

上記の本を読む限りでは、Pearlの統計的因果推論の体系が常用するところの非巡回有向グラフは正に「データ生成プロセスの図像化」みたいなところがありますので、Pearlの体系はモロに「生成モデル的」であると言えます。

で、「あまりに生成モデル的」であるPearlの体系において、それでも「世界全体を生成せずに済ませる」ことを可能にしているのが、「バックドア基準」であると言えるかもしれません。因果効果/措置効果の推定のためには「生成モデルのどの部分までを考慮に含めれば良いのか」という問いに対して、バックドア基準はその「生成モデルの”切り取り方"」を明晰に示すものになります。


とは言え、実際のケースにおいて「切り取り方が明晰に分かる」ためには既に一定程度以上にその生成モデル(非巡回有向グラフ)が明確になっている必要があり、そのような状況でない場合には、傾向スコア解析のような「識別的モデル」を利用した方が実務上は有効な場合が多くなります。

あるいは、Pearlの体系側から見ると、非巡回有向グラフの構造が一部不明瞭な場合に、「バックドアパスに蓋をするための合成変数を識別モデルにより作成してまとめて蓋をする」というアプローチが「傾向スコア」であるという捉え方もできるかもしれません。(*この理解でおそらく正しいと考えていますが、木曜日に黒木さんに確認してみようと思います)

因果推論と識別/生成モデルの周りをぐるぐると巡る

さて。冒頭にご紹介した筒井さんの記事では以下のような記述があります:

因果推論を志向するアプローチと、媒介による説明を志向するアプローチは、この記事でも書きましたが、実は少なくとも回帰モデルにおいてはそれほど異なった分析を生み出すわけではありません。異なってくるのは、因果推論が回帰モデルから離れて、措置効果モデルによって純粋に介入の因果効果を追求するときからです。実験に範をとったこのモデルでは、純粋に原因(介入)と結果の関係を推定するがゆえに、回帰分析では可能であった媒介要因による説明のプロセスが抜け落ちます。観察データに適用される措置モデルでは、外生的な共変量でバランスを取った上で措置の効果を推定するという手続きがとられますので、措置はすでに媒介ではないわけです。逆に言えば、説明のプロセス(≒理論)をスキップできることが統計学の「強さ」の源でもあるわけです。


(...中略...)


因果が複合的に決定されていて、したがってSUTVA違反がむしろ社会の常態であることは、社会学者の感覚としてはある程度共有されているはずです。そうではないと、パネルデータ分析にあまり関心が向かず(ここ最近社会学者のあいだでパネル調査プロジェクトに参加していて、社会学者がいかに措置効果モデル的な因果推論に関心がないのかを痛感しました)、検定といえば個々の係数の効果の検定ではなくログリニアモデルやSEMなどの確証系分析を好み、措置効果モデルよりは複数の変数間の関係を捉えることに向いている回帰モデルを長く愛用してきたという、一見奇妙な計量社会学の傾向性を理解できません。

ここで、「措置効果モデル」というのは、本記事で述べてきたところの傾向スコア解析のような「生成モデルをすっとばす因果推論モデル」に対応するものです。また、「媒介要因による説明のプロセス」というのは正に「生成モデル的アプローチ」による解析に対応するものと考えられます。(この筒井さんの記事もとても面白いのでぜひ全文をご一読ください!)

上記のような社会学者の「因果推論と識別/生成モデル」をめぐる逡巡は、「因果推論とRubin/Pearlの体系」をめぐる逡巡とも相似形を成しているように思います。

識別モデル的な因果解析はクリアカットかつロバストな因果推論をもたらすので有効だし、Pearl的な非巡回有向グラフを用いた「生成モデルからの因果推論」もまた捨てがたし、というようなぐるぐると巡る気持ち、そんな、「同級生のみゆきと妹のみゆき」の間でぐるぐると巡るような気持ち、のまま本記事は終わりたいと思います。


そして来る木曜日は夏の統計的因果推論祭りがやってきます。

*1:CiNiiが利用不可の方は大変申し訳ない

*2:そもそものそもそもの話を言えば、元々は久保さんの日記にある6/19や[ http://hosho.ees.hokudai.ac.jp/~kubo/log/2014/0611.html#10:title=6/20]における識別/生成モデルに関するつぶやきにインスパイアされてこの論文にたどり着きました

*3:一般的にはプロビット回帰やロジスティック回帰モデルが用いられる。ノンパラメトリックなカーネル回帰を用いる場合もあるらしい→『調査観察データの統計科学』p55, p62参照