Take a Risk:林岳彦の研究メモ

自らの研究に関連するエトセトラについてのメモ的ブログです。主にリスク学と統計学を扱っています。

僕は論文が書けない:苦境脱出へ向けての2+1冊

こんにちは。林岳彦です。最近は佐野元春ばかり聴いています*1。将来的にはあんな髪型になりたい。


さて。

「研究者なれども研究しない!」という斬新な決めフレーズでおなじみの雑用戦隊ヒーローシリーズがありますが、かくいう私も何やかんやの雑用に埋もれてここのところ論文を書くペースがすっかり落ち込んでおり*2、そんなこんなのアオリで本ブログも休止しているありさまになっています。

そんな折、私の心の師ともいうべき東北大学の酒井聡樹先生から近刊である『これから論文を書く若者のために 究極の大改訂版』をご恵贈いただいたので今回の記事を書くことにしました。

これから論文を書く若者のために 究極の大改訂版

これから論文を書く若者のために 究極の大改訂版

今回は、久しぶりの【研究hacks】タグの記事になります。今回は院生〜若手〜中堅研究者くらいの方々を想定読者として書いていきます。

(書いてるうちにまたかなり長くなってしまいました。すみません。。。)


論文が書けない それは苦しい

はい。ではまず手始めに事実を確認しておきましょう。論文が書けない。それは苦しいことです。

「飛べない豚はただの豚」という有名なフレーズがありますが、「書けない研究者はただの金髪豚野郎ヒト」であるように思います。

どんなに些細な研究であったとしても、その内容を論文として遺すことにより私たちの研究ははじめてパブリックなものになり、その一つ一つはささやかなものであるかもしれない論文たちが集積しアカデミズムという大河へと連なり人類の学究は悠久の時を超えて続いていくのです。

個々の研究者というものはアカデミズムという大河に浮かぶ一隻の小舟のようなものです。そして言わば「論文が書けない研究者」はこの大河から外れて座礁してしまった存在なのです。もし我々が「論文が書けない」状況に陥ってしまったならば、そしてもし依然「研究者」でありつづけたいのならば、急いでまたその大河へと戻らねばなりません。


どうやって戻るのかって?

論文を書くのです。他に道はありません。

1冊めの紹介:『これから論文を書く若者のために 究極の大改訂版』

はい。では論文を書くための(再)準備を進めていきましょう。

まずは酒井先生からご恵贈いただいた『これから論文を書く若者のために 究極の大改訂版』を採り上げていきます。

(いちおう情報開示のため酒井先生と私の関係性を説明しておきますと、私と酒井先生は15年ほど昔に「大学院生(私)と、私の指導教官(某河田雅圭先生)と仲の良い助教授(酒井先生)」という関係でした。比喩的に言えば、私にとって河田先生が「ダメな親*3」ならば酒井先生は「気さくな叔父さん」というイメージです。私にとってとてもありがたい存在でした)

これから論文を書く若者のために 究極の大改訂版

これから論文を書く若者のために 究極の大改訂版

*酒井先生自身による本書の紹介ページはこちら


さて。「人生で必要な知恵はすべて大学院の修羅場で失った幼稚園の砂場で学んだ」という有名なフレーズがありますが、私にとって本書は「論文書きに必要な知恵はすべてこの本で学んだ」と言っても過言ではない本です。マジ感謝しております。

もしかすると訝しんでおられる方も居るかもしれませんが、決して単に今回ご恵贈いただいたという理由により本書の宣伝をしているわけではありません。私の本書にかける想いはそんなインスタントなものではありません。以下のリンク先に確固たる証拠があります:

Amazon.co.jp: カスタマーレビュー: これから論文を書く若者のために


実は、上記のリンク先にある本書の初版についての『類をみない良書』という題のアマゾンレビューは、私が11年前にテネシー大学でのポスドク時代に書いたものなのです*4。いま改めてこのレビューを読み返すと、私の本書へのほとばしる愛と、元指導教官(某河田先生)へのにじみ出る恨み節が感じられて、我ながらほっこりといたします。


上記の11年前のアマゾンレビューでも書いていますが、「論文を書くスキル」というものは論文を書くことでしか養われない部分があります。多くの場合、筆頭著者で4本、5本、6本と論文を書いていくとだんだん「ああ俺もかなり論文を書くスキルがついたなあ」と思えてくるのではないでしょうか。問題は、では「はじめて論文を書く若者」はどうすれば良いのか、ということになります。

本書はそんな「はじめて論文を書く若者」のために最初の手ほどきをしてくれる稀有な本なのです。


はじめて論文を書く若者は色々なことが分かりません。

イントロダクションをどう書けば良いのかが分からない、メソッドには何をどこまで書けば良いのかが分からない、リザルトには何を書き何を書くべきでないのかが分からない、ディスカッションには何をどう書いていいのかわからない、投稿時のレターには何を書けば良いのかわからない、査読コメントのリプライはどのように書けば良いのか分からない、リジェクトのレターが届いたときにどんな顔をすれば良いのか分からない、など分からないことだらけです。


本書はそんな「(科学)論文の執筆から受理に至るまでの過程において何を書くべきであり何を書くべきではないのか」について丁寧に語ってくれる大変ありがたい本なのです。

「論文の書き方が分からない」という若者の方々、あるいはそのような若者を指導する立場になった研究者の方々には、まず読むべき本として心からオススメしたいと思います。


論文書きという苦境の中に、仄かに希望の光が見えてくる、かもしれません。


2冊めの紹介:『できる研究者の論文生産術 どうすれば「たくさん」書けるのか』

さて。

基本的にポイズンなこの世の中では、残念ながら、論文の書き方は分かっていても論文が書けない状況に陥ることもあります。

「研究者がバスルームで論文を書くのを邪魔をする100の方法」というロリポップ・ソニック改名バンドの有名な曲がありますが、研究者も中堅にさしかかってくると、さまざまな書類書きや会議や教育や学会業務や愛しさや切なさや心強さなどによって、そもそも「研究をする時間/論文を書く時間がない!」という新たな壁にぶち当たるようになります。

その壁をどう乗り越えるのか。その戦略を考える際に参考になるのが、以下の『できる研究者の論文生産術 どうすれば「たくさん」書けるのか』です。

できる研究者の論文生産術 どうすれば「たくさん」書けるのか (KS科学一般書)

できる研究者の論文生産術 どうすれば「たくさん」書けるのか (KS科学一般書)

*出版社による本書の紹介ページはこちら


この本の内容は、本書のはじめに収録されている三中信宏さんによる「推薦のことば:日本語版刊行にあたって」の中で以下のように巧みに要約されてます*5

 本書が掲げるのはたくさん書くための抽象的な精神論ではない。むしろ、この上もなく具体的な行動規範を著者は強調する。とくに重要な点は、文章を書くための時間は”見つける”ものではなく、スケジュール的に”割り振る”という発想の転換である。書く時間をあらかじめ設定し、万難を排してそのスケジュールを死守する書き手を著者は「スケジュール派(schedule-follower)」と呼ぶ。たくさん書くためにはスケジュール派であれ。たしかにこのスローガンを守ることができる研究者はきっとシアワセになれる。ウソではない。

 日頃よく耳にする「もっと時間があったら…」とか「機が熟してから…」とか「もっと調べてから…」という弁解は、単に自分が書かないことに対する見苦しい言い訳にすぎない。ヒソカに罪の意識に苛まれつつ、それでも書くことを先延ばしにしたあげく、締切間際まで追い込まれてからドロナワ夜なべ仕事で書きまくるスタイルを著者は嘲笑して「一気書き(big writing)」と呼ぶ。研究者が「一気書き」に逃避するこのような言い訳を、著者がひとつひとつ論破していくようすはまさに大魔神のごとし。

はい。このような本です。

本書は、日々の多忙さの只中で「書くためのスケジュールをどう確保する(べき)か」という問題について、心理学者である著者が専門的な知見を交えつつ解決策を説いていく本です。その筆致は説得的かつスムーズであり、文章を楽しみながら「書くための時間をあらかじめ確保すること」の大切さとそのための具体的な方法を学べるようになっています。


もしかすると、本書の副題の『どうすれば「たくさん」書けるのか』という部分に対して、「研究者の目指すべきは論文のじゃねーだろーが」と反発を覚える方もいるかもしれません。しかし、実際に読んでみると『「たくさん」書ける』というのは釣りタイトルに近いことが分かります。著者自身が本書のおわりで述べている箇所を引用します*6

本書で説明しているのは、たしかに「どうやって文章をたくさん書くか」かもしれない。でも、たくさん書かねばならないというふうに思い込まないこと。正確を期すということでは、本書のタイトルは『どうやって通常の勤務日に、不安や罪悪感に苛まれずに、より生産的に書くか』にした方がよかったのかもしれない。でも、それでは誰も買ってくれないだろう。

確かに、本書の内容をより正確に表すと『通常の勤務日に、不安や罪悪感に苛まれずに、より生産的に書く方法』になるかと思います。なので、「たくさん書く」の部分に反発を感じた方もご安心ください。


というわけで、寄せては返す雑用の波に揉まれながらも『通常の勤務日に、不安や罪悪感に苛まれずに、より生産的に書きたい』という儚い望みを持ちつづけて日々耐え忍んでいる愛すべき研究者の方々に、本書をオススメしたいと思います。

ちなみに三中信宏さんはこの本に書いてあることを実践したら、なんと1年近く放っておいた翻訳のお仕事がみるみるうちに『たった三週間でまる一冊が翻訳できてしまった』そうですよ。むかしジャンプに載ってたブルワーカーの広告みたいに凄い効果ですね!

+1冊の紹介:『かくかくしかじか』

さてさて。

もちろん、基本的にポイズンなこの世の中では、上記の『できる研究者の論文生産術』を読んだからといって、そもそもの雑用の総量が減るわけではありません。たとえどんなに雑用を減らそうと努力したとしても、エントロピーと雑用が増大しつづけるというのは、宇宙の法則なのです。島本和彦作品の登場人物でもないかぎり、一介の個人が宇宙の法則に勝てるはずがありません。

「研究者が論文を書き始めれば7人の敵がいる、もしくは、11人いる!」という有名なフレーズがありますが、職場の状況によっては、もろもろの雑用による組織への貢献で認められていれば、いつの間にか周りから「論文を書け」と強くは言われなくなってくるかもしれません。研究者も中堅にさしかかると、毎日毎日、何だかんだで雑用を強気で注文してくる人々の数はとても多くなるものですが、それに比べると「論文を書け」と強気で注文をしてくる人の数はとても少なくなっていくものです。

そんな状況の中で、雑用の波に流されずに「論文を書く」ことに情熱と時間を割きつづけることは簡単ではないのかもしれません。

しかし。想像してみてください。

もし、今あなたが後ろに振り向いたらそこに佐野元春が居て、その佐野元春に「きみは雑用がしたくて研究者になったのかい?」と正面から尋ねられたら、あなたは何と答えますか?

「研究です!私は研究がやりたいんです!」と涙ながらに答えるのではないでしょうか。少なくとも私はそう答えるでしょう。研究がやりたいのです。佐野元春相手に嘘はつけません。

しかし、現実とは基本的にポイズンなものです。
現実には、あなたの後ろの正面に佐野元春はいないのです。
現実には研究者も中堅に差し掛かってくると、佐野元春どころか、「論文を書け」と背中を押してくれる人間自体がもう周りからいなくなってくるのです。

寂しいことです。

そんな状況の中堅研究者にオススメしたい作品が、東村アキコさんの『かくかくしかじか』という作品です:

かくかくしかじか 5 (愛蔵版コミックス)

かくかくしかじか 5 (愛蔵版コミックス)

*出版社による本作品の紹介ページはこちら
*本作品についての東村アキコさんのインタビューはこちら


この本は「マンガ大賞2015」も受賞しているたいへん有名なマンガなので、既にご存知の方も多いかと思います。この漫画は、作者である東村アキコさんと、彼女の高校からの絵の師匠である日高先生との関係を描いた自伝的作品です。


もしあなたが中堅研究者であるならば、ぜひこのマンガを読んでみてください。

この『かくかくしかじか』を読み通すと、おそらく、あなたがまだ「これから論文を書く若者」だった頃から研究者として独り立ちするまでに、論文を『書け』とあなたの背中を押してくれた指導教官、大学院の先輩、あるいは色々と世話をしてくれた年長の研究者などなどの顔が思い浮かんでくるのではないかと思います。

そして、もしかしたら、本作品内でのアキコのように、今までそんな方々に不義理を重ねてきたことを思いだして心がしくしくと痛むのかもしれません。


そうならば、今からせめてもの「恩返し」をしましょう。

どう恩返しするのかって?


論文を書くのです。私たちは研究者なのですから。


おわりに:「いつ書くの?」

はい。

今回は以下の3冊(というか2冊と1シリーズですが)の本を紹介いたしました。

これから論文を書く若者のために 究極の大改訂版

これから論文を書く若者のために 究極の大改訂版

できる研究者の論文生産術 どうすれば「たくさん」書けるのか (KS科学一般書)

できる研究者の論文生産術 どうすれば「たくさん」書けるのか (KS科学一般書)

かくかくしかじか 5 (愛蔵版コミックス)

かくかくしかじか 5 (愛蔵版コミックス)

もし上記の3冊(というか2冊と1シリーズ)を読み終えれば、論文を書くための技術も、論文を書くための時間を確保するための段取り法も、論文を書くためのモチベーションも、全てが準備万端となるはずです。


あとは書き始めるだけです。

想像してみてください。


もし佐野元春に「きみはいつ論文を書き始めるんだい?」と尋ねられたら、あなたはどう答えますか?




もちろん答えは・・








SOMEDAY

SOMEDAY









.*7

*1:さいきん『Visitors』のころのライブ映像を見ました。『Visitors』ってヒップホップの印象が強かったですが、ライブ映像を見るとむしろプリンスの影響を強くかんじるなあと思いました。今さらながら意外な発見

*2:もともとペース低いのに、さらに

*3:当時の河田先生はかなりの放置系の先生で院生としては非常に苦しみました。今は元学生として普通に仲良くさせていただいていますが、今でも河田先生に「林君は昔は暗かったけど今は明るくなったね」とか言われると、「院生時代はお前のせいで暗かったんじゃ〜!!」とふつふつと当時の恨みがよみがえります。あと関係ないけどおぎやはぎの矢作さんは河田先生にちょっと似てると思う

*4:昔はアマゾンレビューをけっこう書いたりしてました。今考えるとそんな暇あったら論文書け!っていう話ですね。ちなみに昔書いたレビューの一部は例えば→ http://u666u.info/leYC

*5:同書内頁viiより引用

*6:同書内頁155より引用

*7:すんません。嘘です。。。今日から書き始めましょう!

業務連絡:当面のあいだ更新止まります

こんにちは。林岳彦です。プロレタリア白菜。

すっかりdutyの多重債務状態になりにっちもさっちもアームストロングなので、本ブログおよびtwitterとブクマも当面のあいだ(少なくとも半年以上は)更新止まります。


敬愛する某コロンさんよりは早く帰ってきたいです。

夏の因果推論祭りのフォローアップをこんなに遅れて書くつもりじゃなかった

こんにちは。フリッパーズ・ギターの性格が悪い方こと林岳彦です。

さて。

私も大人でありますので本業に追われることもままあります。そして追われているうちにすっかりご無沙汰してしまいました。はてはて。去る7/11に行われた因果推論祭りについてもブログにはまだ何も書いておりませんでした。申し訳ありませんでした。

まだ色々と余裕がないので、以下、雑感の書き散らしになりますがどうかご容赦を:

なにはともあれご講演をいただいた星野先生&黒木先生に感謝しております

いや本当に感謝あるのみです。大変ありがとうございました。

そして聴講にお越しいただいた方々に感謝いたします

おかげさまで130人の教室がほぼ満員状態になるほどの方々にお越しいただけました。
大変ありがとうございました。

告知がネットやtwitterを中心に広まったこともあり、それぞれに面識も無くまた特に共通のバックグラウンドもない方々が集まり、普段の学会や勉強会とは何かしら異なる雰囲気でした。正直、登壇したときは、いつもより聴講者が「得体の知れない」気がして、近年になく緊張しました。(話をしているうちに和らぎましたが)

幾人か「中の人」にお会いできました

はてなブログ等でご活躍されている幾人かの「中の人」に直接ご挨拶することができました。
直接ご挨拶するのは照れくさいような面映いような、でも嬉しいものですね。
今後とも是非ともよろしくお願いいたします。

セミナーのレベル設定について

レベル設定は難しかったですね。聴講者のバックグラウンドも知識レベルも様々であり、レベル設定が高すぎて付いていけなかった方も、逆に低すぎて物足りなかった方もおられたかと思います。せっかく来ていただいたのに申し訳ない気持ちでいっぱいです。。(皆それぞれお忙しい中で貴重な時間を割いて来てくださっているわけで社交辞令ではなく本当に申し訳なく思っています)

「Pearl vs Rubin」という"アングル"について

私の告知文のせいで「Pearl vs Rubin」というアングルでの議論になりましたが、(人間的な部分でのエピソードの面白さはともかくとして)両者の理論のそもそものスコープの広がりを考えると、「Pearl vs Rubin」というのはあまり両理論の面白さのコアの部分を引き出すアングルではないのかもなあとも思いました(←今更)。

Rubinの潜在的結果変数の枠組みは、実解析において頻繁に直面する、欠測値等を含む「観測されなかったデータ」に対するアプローチとして非常にgeneralなリーチを持つという理論的なワクワク感があります。

一方、Pearlの枠組みは、これまた実解析において頻繁に直面する、(例えば)重回帰分析での変数選択において(AIC等とは全く理論的なレイヤーの異なる)理論的規範を示すというワクワク感があったりします。

こういう理論的な「ワクワク感」にもっとフォーカスできれば良かったかもしれません。

傾向スコア法についての雑感

傾向スコア法の理解や使用において「Pearlの体系の知識は必要ない」と言われると、なんというか、「重回帰分析において偏微分の知識は必要ない」というセリフを聞いたときのようなモヤモヤをかんじるんですよね。いや、確かに、偏微分の知識がなくても重回帰分析はできますし、もしかしたら実際に重回帰ユーザーの大半は偏微分を分かってないかもしれないですが、いや、でも、さ、というような。

個人的な学習体験として、最初に星野さんの本を読んだ時には、傾向スコアの変数選択の部分については本当に天下り的に理解することしかできなかったんですよね。その後、Pearlの体系を学んでから星野さんの本の変数選択の部分を再読したら、いきなり「もう読んだ端から理解できる」という状態になってたんですよ。「傾向スコアとはバックドアに蓋をする合成変数である」という理解*1があると、もう本当に書いてあることがスルスルと(書いてあることがもう自明に感じて読んでいてもどかしさを感じるほどに)理解できるんですよね。

Rubin系の傾向スコアの説明だと、変数選択の部分は殆ど本質的にはempiricalな「How」の説明に終始しているのですが、Pearlの体系は変数選択に際して確固たる理論に基づくnormativeな「Why」の体系を提供してくれているんですよね。やっぱりnormativeな「Why」の部分も理解できていたほうが、(特に非典型的な例に遭遇した場合などに)強いのではないかと思います*2

傾向スコアの理解においてPearlの体系を学ぶことの効用の具体例としては、例えば、「強い無視可能性」の持つ本質的重要性を理解できることが挙げられるかと思います。どうしても、傾向スコアを最初に理解する際には、「傾向スコア←共変量」のモデリングの仕上がり具体の吟味に引きづられてしまうのですが(c統計量の値とか)、本来の「強い無視可能性」の意味を考えれば、実は「応答変数に効いているもの」を変数として選択することが重要なんですよね*3。この辺りは、グラフィカルモデル経由で傾向スコアの概念を理解したほうが分かりやすいように思います(参考:ハーバード白熱教室 これからの因果推論を考えよう)。

参考:吉田さん@Robins派の記事

*こちらに「因果推論祭り」を実際にご聴講いただいた方(吉田さん@Robins派)の感想もありますので合わせてどうぞ:
因果推論祭り、Tokyo.R、機械学習ハッカソンなどの話 - きのう何書いた?

大変ありがとうございます!>吉田さま

なにはともあれ

夏の因果推論祭りにお越しいただいた方、いただけなかった方も、大変ありがとうございました。

はてなブックマークの「学び」の欄が研究不正の話題で埋まっていたりする昨今にあり、純粋な学術的面白さを目当てに東大にお集まりいただいた方々に囲まれて幸せな時間を過ごせました。

今後とも何卒よろしくお願いいたします

参考文献

調査観察データの統計科学―因果推論・選択バイアス・データ融合 (シリーズ確率と情報の科学)

調査観察データの統計科学―因果推論・選択バイアス・データ融合 (シリーズ確率と情報の科学)

統計的因果推論 -モデル・推論・推測-

統計的因果推論 -モデル・推論・推測-

統計的因果推論―回帰分析の新しい枠組み (シリーズ・予測と発見の科学)

統計的因果推論―回帰分析の新しい枠組み (シリーズ・予測と発見の科学)

医学的介入の研究デザインと統計:ランダム化/非ランダム化研究から傾向スコア、操作変数法まで

医学的介入の研究デザインと統計:ランダム化/非ランダム化研究から傾向スコア、操作変数法まで

  • 作者: 木原雅子,木原正博
  • 出版社/メーカー: メディカルサイエンスインターナショナル
  • 発売日: 2013/10/31
  • メディア: 単行本(ソフトカバー)
  • この商品を含むブログを見る
*例えば↑の本なんかだと傾向スコアの変数選択のところは本当にempiricalな「How」しか書いてないんだよなあ...

*1:因果推論祭りの中で、この理解が適切であることを黒木さんに直接確かめることができました

*2:「因果推論」に関して言えば、Rubinの体系は「How」、Pearlの体系は「Why」についての体系であると感じています。なので、ハウツー的手法としてはRubinの方が洗練されていますが、「なぜそのHowが成り立つのか」を深く理解したければPearlの体系を学ぶのが近道であるように思います

*3:この点は星野本でも強調されているのですが、Pearlの体系を理解する以前は、天下り的にしか理解できませんでした

識別/生成モデルの観点から見たRubin/Pearlの統計的因果推論(*既に一定の予備知識のある方向け)

こんにちは。林岳彦です。ついに夏の統計的因果推論祭りが今週の木曜(7/10)に迫ってきました!

ちゃんと予定どおり開催されますので、参加申し込みをされたみなさま、台風に負けずにご来場いただければ幸いでございます。

さてさて。


この祭りに備えてさいきん改めて統計的因果推論の辺りを復習しているのですが、今回は自分のためのメモとして「識別/生成モデルの観点から見たRubin/Pearlの統計的因果推論」について書いてみたいと思います。(ひじょうにマニアックな内容になります)


(今回の記事は「統計的因果推論」に対して既に一定の予備知識がある読者を想定して書いていきますので、多くの方々には意味不明なものになるかもしれませんが大変申し訳ありません)

前置き:今回の元ネタとなる2つの記事の紹介

そもそものことを言いますと、今回の記事は以下の2つの記事にかなり直接的にインスパイアされて書かれたものです。なので、以下の記事をご一読の上でこの記事を読んだほうが、本記事が「そもそもどういうことを考えて書かれたのか」が分かりやすいかと思われます*1

(1)の伊庭さんの論文は、ベイズ統計の流行について「識別モデルと生成モデル」という観点から論じたものです*2

(2)の筒井さんの記事は、社会学における「”因果効果”の推定(措置効果モデル系)」と「媒介による説明(回帰分析系)」を巡る変遷について書かれたものです。

今回の記事では、(1)の論文の「識別モデルと生成モデル」という観点から、(2)の記事の「因果効果の推定 vs 媒介による説明」というテーマについて書いていきます。

まずは用語説明:生成モデル・識別モデルとは?

では、まずは「識別モデル(discriminative model)」と「生成モデル(generative model)」という用語について見ていきます。

「識別/生成モデル」という語に関しては、人によってやや用法に幅があるようですが、まず上記の伊庭(2006)における説明を引用してみます(尚、本論文中では"discriminative model”の訳語として「判別モデル」という語が使われています)

すでに述べたように、生成モデル(generative model)の考え方では、データの生成過程を条件付き確率で表現して、すべての変数の同時分布を書き下し、あとは必要に応じてベイズの公式を使う、というのが基本的な方針である。これに対して、与えられた目的に必要な条件付き確率のみを抜きだしてモデル化する考え方がある。ここでは、これを判別モデル(discriminative model)と呼ぶことにする。


この2つはあくまでもモデル化の上での相対的な方針であって「これが生成モデルで、これは判別モデル」といった絶対的な判断基準があるわけではない。むしろ、生成的なモデル化(generative modeling)と判別的なモデル化(discriminative modeling)のように「方針」としてとらえたほうがよいかもしれない。また、統計的情報処理の目的は「判別」ばかりではないので、一般には「判別的なモデル化」というより「部分的なモデル化」ということになる。


対立点をまとめると

生成モデル
全体をモデル化して、目的に応じてそれを変形して利用する。変形のためにベイズの公式を積極的に利用。
判別モデル
必要のない部分はモデル化しない。ベイズの公式はなるべく使わない。

ということになる。これは「ベイズ」と「非ベイズ」の古典的対立のエッセンスを抜き出したものにも見えるが、二項対立ではなく多数のモデルを整理する軸として提示されている点にちがいがあるし、内容的にもより幅が広くなっている。

はい。ニュアンスも伝わる良い説明だと思います(あやかりたいものです)。(当該論文が入手可能な方は面白いのでぜひ全文をご一読ください!)

一応もういちど地の文でもまとめると:

基本的には(広義には)、「先ずデータの生成プロセスをモデリングする」のを志向するのが「生成的なモデル化」「生成プロセスをすっとばして所与のデータから直接問題を解く」のを志向するのが「判別的(識別的)なモデル化」という言い方ができそうです。

また、実践的には、前者は「生成プロセスを条件付き確率の形で記述→記述さえできれば後は変形してベイズで(さくっとあるいはゴリゴリと)モデルパラメータの計算」という形で、後者は「所与のデータ→基底関数を噛ます→直接問題を解く(問題を解く能力を最大化するようにパラメータを学習させる)」という形で解かれることが多いようです。


どちらのアプローチが良いかというのはケースバイケースとしか言いようがないとは思いますが、(識別/分類そのものが目的である場合の)一般論としては、データ生成プロセスが適切にモデル化可能な場合には生成モデルの方が良いものの、それ以外のケースでは識別モデルの方が良い、と言えるかと思います。


また、一般論として、生成モデルの難点の一つは『生成過程からのモデル化ということを徹底すると、いわば「世界全体」を生成する」ことになってしまい、大変なことになる』(上記の伊庭 2006 から引用)という面も挙げられるかもしれません。この世界の生成プロセスーーー因果の継起ーーーにはアプリオリなキリはないからです。

後述するように、Rubinの体系もPearlの体系も着眼点は違えど「生成過程からのモデル化」に基づく体系として考えることができます。以下では、それらの体系の中で「世界全体を生成せずに済ませる」ための手法として、「傾向スコア」や「バックドア基準」というものを捉えてみたいと思います。

識別/生成モデルの枠組みから見たRubinの統計的因果推論と傾向スコア

はい。では、識別/生成モデルの枠組みからRubinの統計的因果推論の枠組みを眺めてみたいと思います。

調査観察データの統計科学―因果推論・選択バイアス・データ融合 (シリーズ確率と情報の科学)

調査観察データの統計科学―因果推論・選択バイアス・データ融合 (シリーズ確率と情報の科学)

上記の星野さんの本を読む限りでは、Rubinの枠組みは基本的には「潜在的結果変数/欠測値に関する生成モデル的アプローチ」に基づく体系であるように思われます。このアプローチの中で、「欠測データ」の生成プロセスや「反事実的データ(潜在的結果変数)」の生成プロセスを「条件付き確率の形」で全て記述することさえできれば、原理的には後はベイズで計算することができます。

しかしながら、それらの生成プロセスは多くの場合に複雑and/or不明瞭であり、条件付き確率の形で書き切ることは困難です。また、複雑なモデルになると、原理的にはベイズで計算できるとはいってもその実行はなかなか大変になってきます。

そこで、問題の単純化への「抜け道」として良く用いられているのが「傾向スコア」になります。

はい。で、この「傾向スコア」のアプローチは事実上、「条件の”割付"に関する部分を識別的モデル*3で置き換える」ものとして捉えることができるかと思います。

実際に、「傾向スコア」の有用性/汎用性というのは、一般論として「識別モデル」が持つ有用性/汎用性とほぼ重なる部分が多く、共変量と割付に関連する部分の「生成モデル」がよく分からない場合においてもその辺りは全部すっとばしてロバストな推定をもたらしてくれたりするわけです。

(一方、実務上で少し困るところは「傾向スコア算出のための良い(実用に足る)”識別モデル"が得られるかどうかは実際にデータを喰わせて”学習"させてみないと分からない」ところかもしれません。「適切な生成モデルが構築できるか否か」という見通しの方は事前知識から割りと立ちやすい気もするのですが、「良い"識別モデル"が得られるか否か」というのは、実際にやってみないと事前には見通しが立たない面が大きいように思います。これはつまり、例えば、競争的研究資金の申請時などに、「これからデータを集めて、傾向スコアで分析やります!」とまるっと書いてしまうと多少リスキーな面があるということです)


識別/生成モデルの枠組みから見たPearlの統計的因果推論とバックドア基準

さて。次は、Pearlの統計的因果推論の枠組みを眺めてみたいと思います。

統計的因果推論 -モデル・推論・推測-

統計的因果推論 -モデル・推論・推測-

統計的因果推論―回帰分析の新しい枠組み (シリーズ・予測と発見の科学)

統計的因果推論―回帰分析の新しい枠組み (シリーズ・予測と発見の科学)

上記の本を読む限りでは、Pearlの統計的因果推論の体系が常用するところの非巡回有向グラフは正に「データ生成プロセスの図像化」みたいなところがありますので、Pearlの体系はモロに「生成モデル的」であると言えます。

で、「あまりに生成モデル的」であるPearlの体系において、それでも「世界全体を生成せずに済ませる」ことを可能にしているのが、「バックドア基準」であると言えるかもしれません。因果効果/措置効果の推定のためには「生成モデルのどの部分までを考慮に含めれば良いのか」という問いに対して、バックドア基準はその「生成モデルの”切り取り方"」を明晰に示すものになります。


とは言え、実際のケースにおいて「切り取り方が明晰に分かる」ためには既に一定程度以上にその生成モデル(非巡回有向グラフ)が明確になっている必要があり、そのような状況でない場合には、傾向スコア解析のような「識別的モデル」を利用した方が実務上は有効な場合が多くなります。

あるいは、Pearlの体系側から見ると、非巡回有向グラフの構造が一部不明瞭な場合に、「バックドアパスに蓋をするための合成変数を識別モデルにより作成してまとめて蓋をする」というアプローチが「傾向スコア」であるという捉え方もできるかもしれません。(*この理解でおそらく正しいと考えていますが、木曜日に黒木さんに確認してみようと思います)

因果推論と識別/生成モデルの周りをぐるぐると巡る

さて。冒頭にご紹介した筒井さんの記事では以下のような記述があります:

因果推論を志向するアプローチと、媒介による説明を志向するアプローチは、この記事でも書きましたが、実は少なくとも回帰モデルにおいてはそれほど異なった分析を生み出すわけではありません。異なってくるのは、因果推論が回帰モデルから離れて、措置効果モデルによって純粋に介入の因果効果を追求するときからです。実験に範をとったこのモデルでは、純粋に原因(介入)と結果の関係を推定するがゆえに、回帰分析では可能であった媒介要因による説明のプロセスが抜け落ちます。観察データに適用される措置モデルでは、外生的な共変量でバランスを取った上で措置の効果を推定するという手続きがとられますので、措置はすでに媒介ではないわけです。逆に言えば、説明のプロセス(≒理論)をスキップできることが統計学の「強さ」の源でもあるわけです。


(...中略...)


因果が複合的に決定されていて、したがってSUTVA違反がむしろ社会の常態であることは、社会学者の感覚としてはある程度共有されているはずです。そうではないと、パネルデータ分析にあまり関心が向かず(ここ最近社会学者のあいだでパネル調査プロジェクトに参加していて、社会学者がいかに措置効果モデル的な因果推論に関心がないのかを痛感しました)、検定といえば個々の係数の効果の検定ではなくログリニアモデルやSEMなどの確証系分析を好み、措置効果モデルよりは複数の変数間の関係を捉えることに向いている回帰モデルを長く愛用してきたという、一見奇妙な計量社会学の傾向性を理解できません。

ここで、「措置効果モデル」というのは、本記事で述べてきたところの傾向スコア解析のような「生成モデルをすっとばす因果推論モデル」に対応するものです。また、「媒介要因による説明のプロセス」というのは正に「生成モデル的アプローチ」による解析に対応するものと考えられます。(この筒井さんの記事もとても面白いのでぜひ全文をご一読ください!)

上記のような社会学者の「因果推論と識別/生成モデル」をめぐる逡巡は、「因果推論とRubin/Pearlの体系」をめぐる逡巡とも相似形を成しているように思います。

識別モデル的な因果解析はクリアカットかつロバストな因果推論をもたらすので有効だし、Pearl的な非巡回有向グラフを用いた「生成モデルからの因果推論」もまた捨てがたし、というようなぐるぐると巡る気持ち、そんな、「同級生のみゆきと妹のみゆき」の間でぐるぐると巡るような気持ち、のまま本記事は終わりたいと思います。


そして来る木曜日は夏の統計的因果推論祭りがやってきます。

*1:CiNiiが利用不可の方は大変申し訳ない

*2:そもそものそもそもの話を言えば、元々は久保さんの日記にある6/19や[ http://hosho.ees.hokudai.ac.jp/~kubo/log/2014/0611.html#10:title=6/20]における識別/生成モデルに関するつぶやきにインスパイアされてこの論文にたどり着きました

*3:一般的にはプロビット回帰やロジスティック回帰モデルが用いられる。ノンパラメトリックなカーネル回帰を用いる場合もあるらしい→『調査観察データの統計科学』p55, p62参照

【速報告知】渾身のガチ企画:『夏の統計的因果推論祭り』を開催します!(7月10日@東大本郷)*5/23登録締切りました*

(2014/5/23追記)*参加希望者が予定人数に達したため登録を締切りました!*
(2014/5/23追記)*また、参加人数が予想を超えたため「14号教室」→「15号教室」に変わりました*

こんにちは。林岳彦です。赤い彗星の測度は3倍です。

さて。

ここ数年にわたり半可通の分際で統計的因果推論について書き散らしてきたことの罪滅ぼしも兼ねて、以下のセミナーを開催いたします。

わたくしとしては渾身の100%ガチ企画でございます。2014年夏、「統計的因果推論」に興味がある全ての方々のご来場をお待ちしております!*1

第42回 リスク評価勉強会(FoRAM
日時:7月10日(木)13:30~17:30 *2
場所:東京大学本郷キャンパス工学部1号館1階14号教室15号教室MAP


『統計的因果推論セミナー:相関から因果を取り出す1つの原理をめぐる2つの話』
(通称:『夏の統計的因果推論祭り』)


13:30-13:40 林岳彦(本セミナー企画者:国立環境研)
『前説:確率のレイヤーと因果のレイヤー』


13:40-15:10 星野崇宏さん(東京大学)
『Rubinの潜在的結果変数の枠組みによる統計的因果推論:傾向スコア、およびより発展的な話題(仮)』


15:20-16:50 黒木学さん(統計数理研究所)
『Pearlのグラフィカルモデルの枠組みによる統計的因果推論:バックドア基準、およびより発展的な話題(仮)』


16:50- 全体の質疑応答

  • 今回のセミナーはどなたでも聴講可能ですが、人数調整のため聴講には事前登録が必要です
  • 聴講希望の方は、事前登録のためのメールを事務局(foram-desk-ml@aist.go.jp)宛へお送りください(メールのタイトルは『夏の統計的因果推論祭り聴講希望』とし、本文にお名前とご所属をご記入ください)
  • 事前登録人数が予定数に達し次第、登録を締め切らせていただきます
  • 聴講者に必要とされるレベルとしては「少なくとも分散分析と重回帰分析は理解していること」を想定しています


ちなみにもちろん:

星野崇宏さんと言えば、以下の名著の著者であります:

調査観察データの統計科学―因果推論・選択バイアス・データ融合 (シリーズ確率と情報の科学)

調査観察データの統計科学―因果推論・選択バイアス・データ融合 (シリーズ確率と情報の科学)

そして黒木学さんと言えば、以下のPearl本の訳者でございます:

統計的因果推論 -モデル・推論・推測-

統計的因果推論 -モデル・推論・推測-

ガチでしょ? ガチです。100%ガチの講師陣です。


今回のセミナーでは質疑応答の時間も長く取っておりますので、上記の本で分からなかった部分なども(もしあれば)、直接ご質問できる機会もあるかと思います(たぶん)。


繰り返しとなりますが、わたくしとしては渾身のガチ企画でございます。

ぜひ皆様のご来場をお待ちしております!


追伸:本セミナーの講師をご快諾いただいた星野崇宏さん、黒木学さんに改めて心より感謝申し上げます。本当にありがとうございます。

*1:とはいえ、会場サイズによる人数制限がありますので、「我こそは!!」という方はお早めの事前登録をお願いいたします

*2:時間・内容は多少変更の可能性があります

確率概念について説明する(第3-1回):可能な世界の全体を1とする — コルモゴロフによる確率の定理(前編)

こんにちは。林岳彦です。先日、小学生の息子とセブンイレブンに行きました。そこでふと、「あの外壁、あれ本物のレンガじゃなくてただの印刷だから」と息子に教えたところ、それが彼にとっては思いもよらぬことだったようで、実はすべすべとしている外壁に触っては「すっかり騙されてた!(ガーン)」と衝撃を受けていました。小さな子どもをお持ちのみなさま、この世の隠蔽された真実(=セブンイレブンの外壁は印刷)を彼ら/彼女らに教えてみると面白い反応が期待できるかもですよ!


さて。


今回は、前回の記事の続きとして、確率という概念の「規格」について説明していきたいと思います。

(今回はとても長い上に内容がハードかもしれません。いつもながらすみません。。)

前回の軽いまとめ

前回の記事では:

少なくとも、「確率」とは「可能性を数値で表したもの」である

というボンヤリとした出発点から:

「可能である」ということは、「この現実世界@」の近傍の可能世界の集合の枠組みにより表すことができる

というところにまで到達することができました。 (まだ前回の記事を読んでいない方は、そちらをあらかじめお読みください)

今回は、その各々の「可能である」ことの程度を「数値で表す」ためのアプローチ(=確率測度)について説明していきます。


(尚、本シリーズの説明では、数学的/論理学的な厳密性よりも、『可能である』というcrudeな概念が、数学的概念としての『確率』というformalな概念とどういう関係性にあるのか、という部分を示すことをその野心としているため、数学的/論理学的な説明としては不十分な部分が散見されるかもしれません*1。申し訳ありませんが、確率測度や様相論理についてのきちんとした説明をお求めの方は、別途参考文献の方をご参照いただければと思います*2

可能世界全体の部分集合を考える

前回の記事では、「Aは不可能である/可能である/必然である」という表現を一般的な形でまとめると:

  • 「Aは不可能である」=「全ての(近傍の)可能世界においてAは偽である」
  • 「Aは可能である」=「Aが真である(近傍の)可能世界が少なくとも1つある
  • 「Aは必然である」=「全ての(近傍の)可能世界においてAは真である」

と表せることを見てきました。 (ここでの「近傍」というのは「この現実世界@」から見た場合のものになります)

これはつまり、「可能である」ということを「(近傍の)可能世界全体の部分集合」の形で捉えることができる、ということです。

図で表すと:

f:id:takehiko-i-hayashi:20140410163017p:plain:w400

のようになります。大きな円は「(近傍の)可能世界の全体」を表し、オレンジの部分は「Aが真である可能世界の集合」、白の部分は「Aが偽である可能世界の集合」を表しています。

ここで、「Aが真である可能性」を数値で表したい場合には、この「オレンジの部分に対応する部分集合」に対して、何らかの数値を対応させていくことができれば良さそうです。以下では、そのようなアプローチを探っていきます。

(ここで、より本来的には、そもそも「(近傍の)可能世界の全体」自体が、「(荒唐無稽なものも含めた)可能世界の全体」の部分集合であることも視野に入れて考える必要があります。しかし、今回の記事では、「”Aの可能性"に数値を対応させる」という文脈において「荒唐無稽な可能世界」を含めて考えることに余り積極的な意味はない/そもそも「荒唐無稽な可能世界におけるAの真偽」について数値を対応させることやその数値について「足し算ができる」という性質を期待することが妥当ではないかもしれない、という理由により、「(近傍の)可能世界の全体」のみを念頭に考えを進めていきます)

(ちなみに、今回の記事において筆者の頭の中では、確率空間(Ω, F, P)について、「(荒唐無稽なものも含めた)可能世界の全体」が「Ω」、「(近傍の)可能世界の全体」が「F」に対応するというイメージになっています)

確率測度:(近傍の)可能世界全体の部分集合に数値を対応させる

では、(近傍の)可能世界の部分集合に数値を対応させることを考えていきましょう。具体例として、「A = 今から私が百円硬貨を投げたときにオモテが出る」という事象について考えていきます。

まず、今から私(筆者)が百円硬貨を投げると、その硬貨が投げられたときの物理的な軌跡(その空間上の位置や速度や回転の度合いetc..)には無数の場合がありうるでしょう。それらの「無数の場合」を、「投げられた百円硬貨の物理的な軌跡において異なる無数の(近傍の)可能世界」として捉えます。

それらの無数の可能世界に対して、百円硬貨が着地したときにオモテ面が出たかどうかに基づき集合を作成すると、結局のところ、「オモテが出る可能世界(Aが真である可能世界)」と「オモテが出ない可能世界(Aが偽である可能世界)」の2つの可能世界の集合に分けることができるでしょう。図で表すと:

f:id:takehiko-i-hayashi:20140410163114p:plain:w400

となります。大きな円は「(近傍の)可能世界の全体」を表し、オレンジの部分は「オモテが出る可能世界(Aが真である可能世界)の集合」、白の部分は「オモテが出ない可能世界(Aが偽である可能世界)の集合」を表しています。


ここで、『「オモテが出る可能世界(Aが真である可能世界)の集合」に数値を対応させる』のに先立って、その数値の大きさについてのとりうる範囲を定めておきましょう。

単純に考えて、その数値の潜在的な上限は「(近傍の)可能世界の全体における全ての可能世界がオモテが出る可能世界である」ケースに対応し、一方、数字の潜在的な下限は「(近傍の)可能世界の全体における全ての可能世界がオモテが出ない可能世界である」ケースに対応すると考えるのが自然でしょう。ここで、具体的には数値の下限を”0"、数値の上限を"1"とします。図で表すと:

f:id:takehiko-i-hayashi:20140410163140p:plain:w400

というイメージです。このとき、両者の中間のケースとなる「(近傍の)可能世界の全体における一部の可能世界がオモテが出る可能世界である」という場合には、0から1の間の数値が対応すると考えるのがしっくりくるかと思います。

f:id:takehiko-i-hayashi:20140410163210p:plain:w400

はい。

さて、では『「オモテが出る可能世界(Aが真である可能世界)の集合」に数値(実数)を対応させる』というアプローチ自体を図で描いてみたいと思います。いささか抽象的になりますが:

f:id:takehiko-i-hayashi:20140410163241p:plain:w480

のように描けるかと思います。このとき、この上図における「P」 は「部分集合に対して実数を対応させる関数」であり、「確率測度」と呼ばれるものになります。そして、その関数により与えられた値である「P(Aが真である可能世界の集合)」が「Aの確率となります。


抽象的すぎて分かりにくいかもしれないので、具体例で考えてみましょう。例えば、「今から私が百円硬貨を投げたときにオモテが出る確率が0.5である」というのは、上記の枠組みにおいて、「P(今から私が百円硬貨を投げたときにオモテが出る可能世界の集合) = 0.5」に対応します。「P」 は「今から私が百円硬貨を投げたときにオモテが出る可能世界の集合に対して、0.5という実数を対応させる関数」となっています。(ここで”0.5”という数字が対応することの正当性については、確率の「規格」ではなく「内実」の方に関わる問題になります*3

f:id:takehiko-i-hayashi:20140410163306p:plain:w480

上記のように、ある「部分集合に対して実数を対応させる関数」によって「確率」を定式化するのが測度論的確率論の基本的な考え方になります。


測度論的確率論では通常、上記の「部分集合」が含まれる「全体」に関しては、今回のような「可能世界の集合」という言い方はせずに、「諸事象の全体」としての抽象的な「確率空間」というものを最初に想定した説明がなされます。逆に言うと、その「確率空間」と「様相論理/可能世界論」のパラレリズムを明示的に意識しながら確率測度について説明する、というのが今回の記事の骨子となっています(参考→: at_akadaさんによる「確率空間」と「可能世界論」の読み替えメモの記事)。


ここで「測度」というのは「大きさ」というものに関する一般的な概念であり、例えば、数学的には「面積」というものは、2つ組の実数からなるユークリッド空間全体における「部分集合」に対して実数を対応させる関数(測度により定式化されています。この「面積」と同様に、「確率」は数学的には「確率空間/可能世界全体」における「部分集合」に対して実数を対応させる関数(確率測度P)によって定式化されているわけです。

で。

もちろん、その「部分集合に対して実数を対応させる関数(確率測度P)」というものは「関数だったらなんでもよい」というわけではありません。「確率測度」と呼ばれるためにには、以下の「コルモゴロフによる確率の公理」の要件を満たしている必要があります。

というわけで、「コルモゴロフによる確率の公理」について以下で見ていきましょう。

(とは言っても、実は、これまでの「確率」の説明においてあらかじめ確率の公理の要件を満たすように話を進めてきているので、実質的にはおさらいの形になります)

コルモゴロフによる確率の公理

Wikipedia先生によるとコルモゴロフによる確率の公理は次の通りです:

確率測度の定義は、コルモゴロフによる次のような確率の公理の形にまとめることが出来る。

  • 第一公理: 全ての事象の起きる確率は 0 以上 1 以下である; 0 ≤ P(E) ≤ 1 for all EE
  • 第二公理: 全事象 S の起きる確率は 1 である; P(S) = 1 。
  • 第三公理: 可算個の排反事象に関する和の法則が成り立つ; {Ek}k∈N が、どの二つも互いに共通部分を持たないような E の元の可算列ならば

     f:id:takehiko-i-hayashi:20140409221906p:plain

この第一公理は、任意の事象E(= 任意の(近傍の)可能世界の部分集合E)に関してその確率P(E)は「0以上1以下」になるというものです*4。具体的に言うと、P(今から私が百円硬貨を投げたときにオモテが出る)が「0以上1以下」の範囲の値である、ということになります。本記事の説明においても、P(近傍の可能世界の部分集合)は「0以上1以下」範囲の値をとるとしているので、この公理が満たされています。

次の第二公理は、「全事象の確率は1である」というものです。本記事の説明においても、P(近傍の可能世界の全体)= 1としているので、この定理が満たされています。

最後の第三公理は、各事象(=近傍の可能世界における各部分集合)に重なりがない(排反な)場合に、確率の「足し算」が成り立つということです。これは例えば、事象A(=Aが真である可能世界の集合)と事象B(=Bが真である可能世界の集合)に重なりがない場合に、P(A ∨ B) = P(A) + P(B)が成り立つというものです。P(A)とP(B)がそれぞれ事象Aと事象Bの確率空間(=可能世界の全体)内における"面積"のようなものに対応するものと考えれば、この足し算が成り立つのは自然なものであると考えられます。

はい。

というわけで、今回の記事では:

「可能である」ということは、「この現実世界@」の近傍の可能世界の集合の枠組みにより表すことができる

というところから出発し、コルモゴロフによる確率の公理までたどり着くことができました。

(もし説明が煩雑すぎて途中で遭難してしまっていたらすみません。。)

今回のまとめ

はい。

では、今回の内容をまとめます:

  • 「可能である」ということは「(近傍の)可能世界全体の部分集合」の形で捉えることができる
  • 様相論理の理路から「確率空間」を捉えることがもし許容されるならば*5以下のように「確率」を捉えることができる
  • ざっくり言うと:「Aの確率」とは、(近傍の)可能世界全体における「Aが真である可能世界の部分集合」の「大きさ」である
  • もうちょい細かく言うと:(近傍の)可能世界全体において、関数Pが以下の3つの要件を満たすとき、P(Aが真である近傍の可能世界の集合)は「Aの確率」である
    • 0 ≦ P(近傍の可能世界の部分集合)≦ 1
    • P(近傍の可能世界の全体)= 1
    • Aが真である近傍の可能世界の集合」と「Bが真である近傍の可能世界の集合」に重なりがないとき、P(Aが真である近傍の可能世界の集合 ∨ Bが真である近傍の可能世界の集合)= P(Aが真である近傍の可能世界の集合) + P(Bが真である近傍の可能世界の集合)

はい。こんなかんじでしょうか。

で。

あのですね。

もしかすると、数学のセカイから「確率」を眺めている方々にとっては、今回の記事は「野暮の極み」に映っているのかもと想像しています。

なぜかというと、そもそもこういう可能世界論みたいな「哲学的なんちゃらかんちゃら」との関わりあいをキレイに避けられるのが「確率空間」とか「確率測度」みたいなものを援用して考えることの利点でもあるからです。

まあそれは確かにそうなのです。ですが、実務的な観点から言いますと、可能世界論から「確率」を捉えることには:

「可能である」という概念と「確率」概念のあいだのギャップ

を明晰に理解できるようになるという、大きな利点もあるのです。

この「ギャップ」を理解しておくことは、現実のナマナマしい案件を確率論的モデリングの世界に落とし込む際にとても重要になります。


今回の記事の後編として、次回の記事ではその『「可能である」という概念と「確率」概念のあいだのギャップ』について書いていきたいと思います。

<参考文献>

プログラミングのための確率統計

プログラミングのための確率統計

のっけから測度論的なアイデア*6からの確率概念の説明がされています(そして、その説明の仕方がほとんど可能世界論的です)。書きぶりがとても面白くて親切で、個人的には確率統計の教科書としてとても大好きな本です。プログラミングはほとんど関係ないのに『プログラミングのための』という題名になっていることで読者が限定されてしまっている気がするのだけが残念です。本当に良い本だと思います。みんなこの本を読めばいいのにと思います。

応用のための 確率論入門

応用のための 確率論入門

ガチの測度論から導入される確率論の教科書です。こちらの本の語り口も大好きです(私は数学力不足のためこの本の前半部しか理解はできていませんが)。とはいえ、こういうガチの測度論から入る本に「入門」というタイトルを付けるのは読者のミスマッチの原因になるのでやめた方が良いなあとは思います*7。いわゆる初学者向けの入門書の類ではありません!

<参考サイト>

雑記2008年3月26日(水) - うつし世はゆめ / 夜のゆめもゆめ
at-akadaさんによる可能世界論と確率空間の読み替えについてのメモです。参考にさせていただきました。多謝です。



.

*1:できるだけちゃんとした説明となるように頑張りましたが、正直限界も感じています

*2:尚、本シリーズの内容については、論理学/分析哲学畑の共同研究者と共に細部を詰めた後に、総説論文等の形で発表することを予定しています

*3:確率の「内実」に関わる、主観確率や頻度的確率等々の考え方については次々回以降に説明していきます

*4:ただしEは完全加法性を満たすとする

*5:そんなん認めないやい!という見解も当然ありだとは思います

*6:測度論そのものが解説されているわけではないですが

*7:勘違いして買った人がAmazonに酷評レビューを載せてるのを見るのは全方位的に悲しい

確率概念について説明する(第2回):そもそも「可能である」とはどういうことか? — 可能世界論

どもっす。林岳彦です。さいきん軽い気持ちで某国際誌の総説論文の査読を引き受けたのですが、「どんな論文だろ?」と思いつつ査読対象の原稿をいざダウンロードしてみたら本文100頁アンド全体300頁もある超長尺の総説であることに気づき、「殺す気か!」「査読テロやで!」と思いました。

いやでもまじで300頁もレビューするの? この悲しみをどうすりゃいいの? 誰がぼくを救ってくれるの? この世はまさに大迷惑???

というかんじです。もう街のはずれでシュビドゥバーです。


いやもうホントに「レビュワー感謝の日」みたいの作ったほうが良いよね。


というわけで。


今回から、確率概念について説明していきたいと思います。

(今回も非常に長い記事になってしまいました。すみません。。。)


確率という概念の「規格」について、様相論理を経由して説明します

前回の今シリーズの概要説明の記事で書いたように、まずは、確率という概念の「規格」について説明していきたいと思います。

ここでの「規格」という語は、「概念としての確率」が持っている「要件」みたいなものを指しています。例えば、「確率は黄色である」「確率は150km/hである」という言い方は意味が通っていないですよね。つまり、確率概念は「色」でもなければ「時速」でもないわけです。

本記事では、ひとまずは『どのような要件を満たす〇〇のときに「確率は◯◯である」という文の意味が通るか』を考えることを通して、「確率とは何か?」についてじわじわと考えていきたいと思います。

ちなみに、一般的には、この問い(確率概念が持つべき「要件」)の答えとしては単純にコルモゴロフの確率の定理を引いて終わりにすることも多いか思いますが、本シリーズではより原理的に様相論理を経由しながらの説明をしていきます。

まずはなるべくボンヤリと:「確率」って「可能性を数値で表したもの」ですよね

まずはなるべくボンヤリと考えていきます。あ。先に言っておきますが、本シリーズの大方針としては、なるべく日常的なボンヤリとしたものから徐々にformalな形へと展開していく形で説明をしていきたいと思います。(「まずはなるべくボンヤリと考える」=「まずは大域的サーチから始める」というイメージです)

さて。なるべくボンヤリと「確率ってなんだろう」と考えてみましょう。わたしの場合、ボンヤリと考えた結果:

少なくとも、「確率」とは「可能性を数値で表したもの」

というのを先ずは思いつきました。まあ、ボンヤリと考えを巡らせるための出発点としては悪くないように思います。

はい。

ひとまず、確率は「可能性を数値で表したもの」であるとしましょう。さて。では、その「可能性」というものはいったい何なのでしょうか?

「可能である」とはそもそもどういうことか

さてさて。「可能性」とはいったい何でしょうか。

ちょっと途方もない問いのようにも思いますが、学問というのはありがたいものでひと通りの考え方が既に整理されていたりします。以下では、論理学/分析哲学における様相論理の考え方をベースに考えを進めていきたいと思います。


さて。ひとまず、「可能性」というのは「可能であるという性質」という意味であると考えられると思うので、ここではさらにそのコアを為す部分である:

可能である」とは何か

について考えていきます。

ここで、とりあえずの方針として、任意の事象Aについての:

「Aは可能である

という文について考えていきましょう・・・と思ったのですが、ここで抽象的に”A"と書いても我ながら余りにピンとこなかったので、より具体的な例をAに代入して:

「A = 2020年にブエノスアイレスに雪がふること」

という例を用いて考えを進めていきたいと思います*1

さてさて。ではでは:

「2020年にブエノスアイレスに雪がふることは可能である

という文において「可能である」というのは一体どういう意味なのかについて考えていきます。


まず上記の文に対応するものとして浮かぶのは「今までもブエノスアイレスに雪がふったことがある」という意味内容かもしれません。ふむふむ。これは良さそうです。

しかし、もしここで逆に考えを辿ってみると、「今までブエノスアイレスに雪がふったことがない」ならば、「2020年にブエノスアイレスに雪がふることは可能でない」ということになってしまいます。これは、そうとも言い切れないように思います。

というか、この論法が正しければ、「初めて起こること」は全て「可能である」ことの範囲に入らなくなってしまいます。(例えば、「今まで私がNatureに論文を載せたことがない」ことをもって、「私がNatureに論文を載せることは可能である」ということが論理的に否定されるかというと、そういうわけではありません・・・論理的には・・・)

逆から考えてみると考えやすそうなので、もう少し逆から考えてみましょう:

「2020年にブエノスアイレスに雪がふることは不可能である(=可能でない)」

とはどういう意味でしょうか?

これは、単に「今までブエノスアイレスに雪がふったことがない」ということだけではなさそうです。もっと意味内容として適切なのは:

いかなる場合・条件においても、2020年にブエノスアイレスに雪は降らない」

といった意味内容になるかと思います。これは、上記の文中の「不可能である」ということの意味内容にちゃんと対応しています(よね?)。

一方、ここからひるがえって、「2020年にブエノスアイレスに雪がふることは可能である」という文については:

「2020年にブエノスアイレスに雪が降るような場合・条件が少なくとも1つある

という意味内容を対応させることができます。これは、上記の文中の「可能である」ということの意味内容にちゃんと対応しています(よね?)。

はい。

ここでまとめとして一般的/抽象的な形式に戻しますと:

「Aは不可能である」=「いかなる場合・条件においてもAは真ではない」
「Aは可能である」=「Aが真であるような場合・条件が少なくとも1つある

と表すことができます。

ここまではよろしいでしょうか。

(*この辺りの議論をもっと厳密に行うためには、論理式を用いて考えることが必要となってきます。論理式を用いた説明については本記事末の参考文献をご参照ください)

可能世界という枠組みを導入する

はい。上記でボンヤリと考えてきた結果として:

「Aは不可能である」=「いかなる場合・条件においてもAは真ではない」
「Aは可能である」=「Aが真であるような場合・条件が少なくとも1つある

というところまで到達することができました。

ではここで満を持して、「可能世界possible worlds)」という言葉/枠組みを導入したいと思います。とはいえ大したことをするわけではなく、上記の「異なる場合・条件」という表現を「異なる場合・条件が成立している世界」という表現/枠組みで捉えていくだけです。

例えば、「2020年にブエノスアイレスに雪がふる」ことに関して「2019年の南半球の平均海水温」が重要な要因となっている場合を考えてみましょう。

ここで、「2019年の南半球の平均海水温が10度であるという条件において」という条件文を「2019年の南半球の平均海水温が10度である世界において」という表現/枠組みで捉えていくのが可能世界論のアプローチになります。(*注意*分析哲学/様相論理のプロから見てこの説明が妥当なのかは正直あまり自信がないです)

このとき、可能世界は無数に存在することができて、「2019年の南半球の平均海水温が10度である世界」「2019年の南半球の平均海水温が11度である世界」「2019年の南半球の平均海水温が12度である世界」「2019年の南半球の平均海水温が13度である世界」・・・などなどの諸「可能世界」が存在しうることになります。

もちろん、可能世界としては「平均海水温において異なる諸世界」だけではなく、他のあらゆる事項についての諸「可能世界」を考えることができます。


そのようなあらゆる事項についての諸「可能世界」が存在するという枠組みを用いると、「2020年にブエノスアイレスに雪がふることが可能である/不可能である」という文の意味内容を:

  • 「2020年にブエノスアイレスに雪がふることは不可能である」=「全ての可能世界において2020年にブエノスアイレスに雪はふらない」
  • 「2020年にブエノスアイレスに雪がふることは可能である」=「2020年にブエノスアイレスに雪がふる可能世界が少なくとも1つある

という「可能世界の集合」にもとづく枠組みにより表現することができます。

ついでに言うと「2020年にブエノスアイレスに雪がふることは必然である」というのは:

  • 「2020年にブエノスアイレスに雪がふることは必然である」=「全ての可能世界において2020年にブエノスアイレスに雪がふる」

と表すことができます。

可能世界論の枠組みに基づき「必然性」を表現すると、「全ての可能世界において真である」になるわけです。

さて。

以上で見てきた例は未来における可能世界の例ですが、現在や過去の例でも「可能世界」を考えることはできます。例えば、「2014年3月における日本の総理大臣が安倍晋三である」という可能世界も、「2014年3月における日本の総理大臣が菅直人である」という可能世界も考えることができます。この前者は「事実的世界(factual world)」であり*2、後者は「反事実的世界(counterfactual world)」と呼ばれるものになります。(ちなみに、統計的因果推論ではこの反事実的世界をどう捉えるのかが本質的なテーマとなっています→ 過去記事例1過去記事例2

また、可能世界としてはもっと荒唐無稽な世界も考えることができます。例えば、「ある朝に目を覚ましたときにあなたが巨大な虫になっている世界」や「この世界と全く同じ内容を持つが時間の流れだけが未来から過去へと進んでいる世界」も可能世界の1つとして考えることができます。

ただし、そのような荒唐無稽な世界まで考えた場合には、おおよそ言語で表現できるものはなんでも「可能」になってしまいそうなので、「私たちが居るこの世界(今後、「この現実世界@」と表記します)」の近傍の可能世界のことだけを考えることもあります。ここで、「近傍の可能世界」というのは、「この現実世界@」から大きく隔たらないような諸可能世界のことになります。例えば、「ある朝に目を覚ましたときにあなたが巨大な虫になっている」ことが真である世界というのは、「この現実世界@」とは異なる物理法則や生物的法則が支配している世界であると考えられるため、「この現実世界@」の「近傍の可能世界」とは言えないでしょう。

日常的用語としての「可能である」という句の用法をベースに考えることが目的であるならば、「この現実世界@」の近傍の世界に「可能世界」の範囲を定めるほうがよさそうです。(荒唐無稽な条件においてのみ成立する事象に対しては、我々は通常は「可能である」という語を用いないので)

このとき、「Aは不可能である/可能である/必然である」というのを一般的/抽象的な形でまとめると:

  • 「Aは不可能である」=「全ての(近傍の)可能世界においてAは偽である」
  • 「Aは可能である」=「Aが真である(近傍の)可能世界が少なくとも1つある
  • 「Aは必然である」=「全ての(近傍の)可能世界においてAは真である」

と表すことができます。上記での「近傍」というのは「この現実世界@」から見た場合のものになります。

このように、「可能である」ということについては、「この現実世界@」の近傍の可能世界の集合の枠組みにより表すことができるわけです。

まとめ

はい。というわけで、今回の記事では:

少なくとも、「確率」とは「可能性を数値で表したもの」

というボンヤリとした出発点から:

「可能である」ということについては、「この現実世界@」の近傍の可能世界の集合の枠組みにより表すことができる

というところまで到達することができました。

一応、今回の記事の内容をまとめておきましょう:

  • 可能世界論のアプローチでは「条件ZにおけるA」というのを「Zが成立する世界におけるA」と捉える
  • 可能世界は無数に存在しうる
  • 「この現実世界@」で真であることが真である可能世界は「事実的世界(factual world)」である
  • 「この現実世界@」で真であることが偽である可能世界は「反事実的世界(counterfactual world)」である
  • ちなみに統計的因果推論ではこの「反事実的世界」をどう捉えるのかが本質的なテーマである(過去記事例1過去記事例2
  • 「可能世界の集合」により「不可能性/可能性/必然性」を表すことができる
    • 「Aは不可能である」=「全ての可能世界においてAは偽である」
    • 「Aは可能である」=「Aが真である可能世界が少なくとも1つある」
    • 「Aは必然である」=「全ての可能世界においてAは真である」

はい。だいだいこんなかんじになるかと思います。


本シリーズの次回(第3回)では、「可能世界の集合における各可能世界の”面積”を数字で表す」というアプローチにより、可能世界論からコルモゴロフの確率の定理へのソフトランディングを試みていきたいと思います。

参考文献

今回の記事における様相論理/可能世界論の説明には不備があるかもしれないので、適宜以下の文献をご参照いただければと思います。何卒よろしくお願いいたします。

論理学をつくる

論理学をつくる

論理学一般のちょう分厚いテキストです。様相論理についても載っています。

可能世界の哲学―「存在」と「自己」を考える (NHKブックス)

可能世界の哲学―「存在」と「自己」を考える (NHKブックス)

可能世界論についての日本語で書かれた入門書です。この本を読んだことで私はこの路線に深入りしてしまいました。

多宇宙と輪廻転生―人間原理のパラドクス

多宇宙と輪廻転生―人間原理のパラドクス

さらに可能世界という考え方をこじらすとこんなふうになるという本です。素敵だと思います*3

*1:もちろんここで「ブエノスアイレス」という固有名の問題には深入りしませんがご容赦ください。さすがにそこに深入りするほどの勇気はないっす

*2:もし私とあなたが同一の「この世界」に居るのならば、ですが

*3:素敵という言葉と素数という言葉は近傍に存在すると思います