Take a Risk:林岳彦の研究メモ

自らの研究に関連するエトセトラについてのメモ的ブログです。主にリスク学と統計学を扱っています。

【速報告知】渾身のガチ企画:『夏の統計的因果推論祭り』を開催します!(7月10日@東大本郷)*5/23登録締切りました*

(2014/5/23追記)*参加希望者が予定人数に達したため登録を締切りました!*
(2014/5/23追記)*また、参加人数が予想を超えたため「14号教室」→「15号教室」に変わりました*

こんにちは。林岳彦です。赤い彗星の測度は3倍です。

さて。

ここ数年にわたり半可通の分際で統計的因果推論について書き散らしてきたことの罪滅ぼしも兼ねて、以下のセミナーを開催いたします。

わたくしとしては渾身の100%ガチ企画でございます。2014年夏、「統計的因果推論」に興味がある全ての方々のご来場をお待ちしております!*1

第42回 リスク評価勉強会(FoRAM
日時:7月10日(木)13:30~17:30 *2
場所:東京大学本郷キャンパス工学部1号館1階14号教室15号教室MAP


『統計的因果推論セミナー:相関から因果を取り出す1つの原理をめぐる2つの話』
(通称:『夏の統計的因果推論祭り』)


13:30-13:40 林岳彦(本セミナー企画者:国立環境研)
『前説:確率のレイヤーと因果のレイヤー』


13:40-15:10 星野崇宏さん(東京大学)
『Rubinの潜在的結果変数の枠組みによる統計的因果推論:傾向スコア、およびより発展的な話題(仮)』


15:20-16:50 黒木学さん(統計数理研究所)
『Pearlのグラフィカルモデルの枠組みによる統計的因果推論:バックドア基準、およびより発展的な話題(仮)』


16:50- 全体の質疑応答

  • 今回のセミナーはどなたでも聴講可能ですが、人数調整のため聴講には事前登録が必要です
  • 聴講希望の方は、事前登録のためのメールを事務局(foram-desk-ml@aist.go.jp)宛へお送りください(メールのタイトルは『夏の統計的因果推論祭り聴講希望』とし、本文にお名前とご所属をご記入ください)
  • 事前登録人数が予定数に達し次第、登録を締め切らせていただきます
  • 聴講者に必要とされるレベルとしては「少なくとも分散分析と重回帰分析は理解していること」を想定しています


ちなみにもちろん:

星野崇宏さんと言えば、以下の名著の著者であります:

調査観察データの統計科学―因果推論・選択バイアス・データ融合 (シリーズ確率と情報の科学)

調査観察データの統計科学―因果推論・選択バイアス・データ融合 (シリーズ確率と情報の科学)

そして黒木学さんと言えば、以下のPearl本の訳者でございます:

統計的因果推論 -モデル・推論・推測-

統計的因果推論 -モデル・推論・推測-

ガチでしょ? ガチです。100%ガチの講師陣です。


今回のセミナーでは質疑応答の時間も長く取っておりますので、上記の本で分からなかった部分なども(もしあれば)、直接ご質問できる機会もあるかと思います(たぶん)。


繰り返しとなりますが、わたくしとしては渾身のガチ企画でございます。

ぜひ皆様のご来場をお待ちしております!


追伸:本セミナーの講師をご快諾いただいた星野崇宏さん、黒木学さんに改めて心より感謝申し上げます。本当にありがとうございます。

*1:とはいえ、会場サイズによる人数制限がありますので、「我こそは!!」という方はお早めの事前登録をお願いいたします

*2:時間・内容は多少変更の可能性があります

確率概念について説明する(第3-1回):可能な世界の全体を1とする — コルモゴロフによる確率の定理(前編)

こんにちは。林岳彦です。先日、小学生の息子とセブンイレブンに行きました。そこでふと、「あの外壁、あれ本物のレンガじゃなくてただの印刷だから」と息子に教えたところ、それが彼にとっては思いもよらぬことだったようで、実はすべすべとしている外壁に触っては「すっかり騙されてた!(ガーン)」と衝撃を受けていました。小さな子どもをお持ちのみなさま、この世の隠蔽された真実(=セブンイレブンの外壁は印刷)を彼ら/彼女らに教えてみると面白い反応が期待できるかもですよ!


さて。


今回は、前回の記事の続きとして、確率という概念の「規格」について説明していきたいと思います。

(今回はとても長い上に内容がハードかもしれません。いつもながらすみません。。)

前回の軽いまとめ

前回の記事では:

少なくとも、「確率」とは「可能性を数値で表したもの」である

というボンヤリとした出発点から:

「可能である」ということは、「この現実世界@」の近傍の可能世界の集合の枠組みにより表すことができる

というところにまで到達することができました。 (まだ前回の記事を読んでいない方は、そちらをあらかじめお読みください)

今回は、その各々の「可能である」ことの程度を「数値で表す」ためのアプローチ(=確率測度)について説明していきます。


(尚、本シリーズの説明では、数学的/論理学的な厳密性よりも、『可能である』というcrudeな概念が、数学的概念としての『確率』というformalな概念とどういう関係性にあるのか、という部分を示すことをその野心としているため、数学的/論理学的な説明としては不十分な部分が散見されるかもしれません*1。申し訳ありませんが、確率測度や様相論理についてのきちんとした説明をお求めの方は、別途参考文献の方をご参照いただければと思います*2

可能世界全体の部分集合を考える

前回の記事では、「Aは不可能である/可能である/必然である」という表現を一般的な形でまとめると:

  • 「Aは不可能である」=「全ての(近傍の)可能世界においてAは偽である」
  • 「Aは可能である」=「Aが真である(近傍の)可能世界が少なくとも1つある
  • 「Aは必然である」=「全ての(近傍の)可能世界においてAは真である」

と表せることを見てきました。 (ここでの「近傍」というのは「この現実世界@」から見た場合のものになります)

これはつまり、「可能である」ということを「(近傍の)可能世界全体の部分集合」の形で捉えることができる、ということです。

図で表すと:

f:id:takehiko-i-hayashi:20140410163017p:plain:w400

のようになります。大きな円は「(近傍の)可能世界の全体」を表し、オレンジの部分は「Aが真である可能世界の集合」、白の部分は「Aが偽である可能世界の集合」を表しています。

ここで、「Aが真である可能性」を数値で表したい場合には、この「オレンジの部分に対応する部分集合」に対して、何らかの数値を対応させていくことができれば良さそうです。以下では、そのようなアプローチを探っていきます。

(ここで、より本来的には、そもそも「(近傍の)可能世界の全体」自体が、「(荒唐無稽なものも含めた)可能世界の全体」の部分集合であることも視野に入れて考える必要があります。しかし、今回の記事では、「”Aの可能性"に数値を対応させる」という文脈において「荒唐無稽な可能世界」を含めて考えることに余り積極的な意味はない/そもそも「荒唐無稽な可能世界におけるAの真偽」について数値を対応させることやその数値について「足し算ができる」という性質を期待することが妥当ではないかもしれない、という理由により、「(近傍の)可能世界の全体」のみを念頭に考えを進めていきます)

(ちなみに、今回の記事において筆者の頭の中では、確率空間(Ω, F, P)について、「(荒唐無稽なものも含めた)可能世界の全体」が「Ω」、「(近傍の)可能世界の全体」が「F」に対応するというイメージになっています)

確率測度:(近傍の)可能世界全体の部分集合に数値を対応させる

では、(近傍の)可能世界の部分集合に数値を対応させることを考えていきましょう。具体例として、「A = 今から私が百円硬貨を投げたときにオモテが出る」という事象について考えていきます。

まず、今から私(筆者)が百円硬貨を投げると、その硬貨が投げられたときの物理的な軌跡(その空間上の位置や速度や回転の度合いetc..)には無数の場合がありうるでしょう。それらの「無数の場合」を、「投げられた百円硬貨の物理的な軌跡において異なる無数の(近傍の)可能世界」として捉えます。

それらの無数の可能世界に対して、百円硬貨が着地したときにオモテ面が出たかどうかに基づき集合を作成すると、結局のところ、「オモテが出る可能世界(Aが真である可能世界)」と「オモテが出ない可能世界(Aが偽である可能世界)」の2つの可能世界の集合に分けることができるでしょう。図で表すと:

f:id:takehiko-i-hayashi:20140410163114p:plain:w400

となります。大きな円は「(近傍の)可能世界の全体」を表し、オレンジの部分は「オモテが出る可能世界(Aが真である可能世界)の集合」、白の部分は「オモテが出ない可能世界(Aが偽である可能世界)の集合」を表しています。


ここで、『「オモテが出る可能世界(Aが真である可能世界)の集合」に数値を対応させる』のに先立って、その数値の大きさについてのとりうる範囲を定めておきましょう。

単純に考えて、その数値の潜在的な上限は「(近傍の)可能世界の全体における全ての可能世界がオモテが出る可能世界である」ケースに対応し、一方、数字の潜在的な下限は「(近傍の)可能世界の全体における全ての可能世界がオモテが出ない可能世界である」ケースに対応すると考えるのが自然でしょう。ここで、具体的には数値の下限を”0"、数値の上限を"1"とします。図で表すと:

f:id:takehiko-i-hayashi:20140410163140p:plain:w400

というイメージです。このとき、両者の中間のケースとなる「(近傍の)可能世界の全体における一部の可能世界がオモテが出る可能世界である」という場合には、0から1の間の数値が対応すると考えるのがしっくりくるかと思います。

f:id:takehiko-i-hayashi:20140410163210p:plain:w400

はい。

さて、では『「オモテが出る可能世界(Aが真である可能世界)の集合」に数値(実数)を対応させる』というアプローチ自体を図で描いてみたいと思います。いささか抽象的になりますが:

f:id:takehiko-i-hayashi:20140410163241p:plain:w480

のように描けるかと思います。このとき、この上図における「P」 は「部分集合に対して実数を対応させる関数」であり、「確率測度」と呼ばれるものになります。そして、その関数により与えられた値である「P(Aが真である可能世界の集合)」が「Aの確率となります。


抽象的すぎて分かりにくいかもしれないので、具体例で考えてみましょう。例えば、「今から私が百円硬貨を投げたときにオモテが出る確率が0.5である」というのは、上記の枠組みにおいて、「P(今から私が百円硬貨を投げたときにオモテが出る可能世界の集合) = 0.5」に対応します。「P」 は「今から私が百円硬貨を投げたときにオモテが出る可能世界の集合に対して、0.5という実数を対応させる関数」となっています。(ここで”0.5”という数字が対応することの正当性については、確率の「規格」ではなく「内実」の方に関わる問題になります*3

f:id:takehiko-i-hayashi:20140410163306p:plain:w480

上記のように、ある「部分集合に対して実数を対応させる関数」によって「確率」を定式化するのが測度論的確率論の基本的な考え方になります。


測度論的確率論では通常、上記の「部分集合」が含まれる「全体」に関しては、今回のような「可能世界の集合」という言い方はせずに、「諸事象の全体」としての抽象的な「確率空間」というものを最初に想定した説明がなされます。逆に言うと、その「確率空間」と「様相論理/可能世界論」のパラレリズムを明示的に意識しながら確率測度について説明する、というのが今回の記事の骨子となっています(参考→: at_akadaさんによる「確率空間」と「可能世界論」の読み替えメモの記事)。


ここで「測度」というのは「大きさ」というものに関する一般的な概念であり、例えば、数学的には「面積」というものは、2つ組の実数からなるユークリッド空間全体における「部分集合」に対して実数を対応させる関数(測度により定式化されています。この「面積」と同様に、「確率」は数学的には「確率空間/可能世界全体」における「部分集合」に対して実数を対応させる関数(確率測度P)によって定式化されているわけです。

で。

もちろん、その「部分集合に対して実数を対応させる関数(確率測度P)」というものは「関数だったらなんでもよい」というわけではありません。「確率測度」と呼ばれるためにには、以下の「コルモゴロフによる確率の公理」の要件を満たしている必要があります。

というわけで、「コルモゴロフによる確率の公理」について以下で見ていきましょう。

(とは言っても、実は、これまでの「確率」の説明においてあらかじめ確率の公理の要件を満たすように話を進めてきているので、実質的にはおさらいの形になります)

コルモゴロフによる確率の公理

Wikipedia先生によるとコルモゴロフによる確率の公理は次の通りです:

確率測度の定義は、コルモゴロフによる次のような確率の公理の形にまとめることが出来る。

  • 第一公理: 全ての事象の起きる確率は 0 以上 1 以下である; 0 ≤ P(E) ≤ 1 for all EE
  • 第二公理: 全事象 S の起きる確率は 1 である; P(S) = 1 。
  • 第三公理: 可算個の排反事象に関する和の法則が成り立つ; {Ek}k∈N が、どの二つも互いに共通部分を持たないような E の元の可算列ならば

     f:id:takehiko-i-hayashi:20140409221906p:plain

この第一公理は、任意の事象E(= 任意の(近傍の)可能世界の部分集合E)に関してその確率P(E)は「0以上1以下」になるというものです*4。具体的に言うと、P(今から私が百円硬貨を投げたときにオモテが出る)が「0以上1以下」の範囲の値である、ということになります。本記事の説明においても、P(近傍の可能世界の部分集合)は「0以上1以下」範囲の値をとるとしているので、この公理が満たされています。

次の第二公理は、「全事象の確率は1である」というものです。本記事の説明においても、P(近傍の可能世界の全体)= 1としているので、この定理が満たされています。

最後の第三公理は、各事象(=近傍の可能世界における各部分集合)に重なりがない(排反な)場合に、確率の「足し算」が成り立つということです。これは例えば、事象A(=Aが真である可能世界の集合)と事象B(=Bが真である可能世界の集合)に重なりがない場合に、P(A ∨ B) = P(A) + P(B)が成り立つというものです。P(A)とP(B)がそれぞれ事象Aと事象Bの確率空間(=可能世界の全体)内における"面積"のようなものに対応するものと考えれば、この足し算が成り立つのは自然なものであると考えられます。

はい。

というわけで、今回の記事では:

「可能である」ということは、「この現実世界@」の近傍の可能世界の集合の枠組みにより表すことができる

というところから出発し、コルモゴロフによる確率の公理までたどり着くことができました。

(もし説明が煩雑すぎて途中で遭難してしまっていたらすみません。。)

今回のまとめ

はい。

では、今回の内容をまとめます:

  • 「可能である」ということは「(近傍の)可能世界全体の部分集合」の形で捉えることができる
  • 様相論理の理路から「確率空間」を捉えることがもし許容されるならば*5以下のように「確率」を捉えることができる
  • ざっくり言うと:「Aの確率」とは、(近傍の)可能世界全体における「Aが真である可能世界の部分集合」の「大きさ」である
  • もうちょい細かく言うと:(近傍の)可能世界全体において、関数Pが以下の3つの要件を満たすとき、P(Aが真である近傍の可能世界の集合)は「Aの確率」である
    • 0 ≦ P(近傍の可能世界の部分集合)≦ 1
    • P(近傍の可能世界の全体)= 1
    • Aが真である近傍の可能世界の集合」と「Bが真である近傍の可能世界の集合」に重なりがないとき、P(Aが真である近傍の可能世界の集合 ∨ Bが真である近傍の可能世界の集合)= P(Aが真である近傍の可能世界の集合) + P(Bが真である近傍の可能世界の集合)

はい。こんなかんじでしょうか。

で。

あのですね。

もしかすると、数学のセカイから「確率」を眺めている方々にとっては、今回の記事は「野暮の極み」に映っているのかもと想像しています。

なぜかというと、そもそもこういう可能世界論みたいな「哲学的なんちゃらかんちゃら」との関わりあいをキレイに避けられるのが「確率空間」とか「確率測度」みたいなものを援用して考えることの利点でもあるからです。

まあそれは確かにそうなのです。ですが、実務的な観点から言いますと、可能世界論から「確率」を捉えることには:

「可能である」という概念と「確率」概念のあいだのギャップ

を明晰に理解できるようになるという、大きな利点もあるのです。

この「ギャップ」を理解しておくことは、現実のナマナマしい案件を確率論的モデリングの世界に落とし込む際にとても重要になります。


今回の記事の後編として、次回の記事ではその『「可能である」という概念と「確率」概念のあいだのギャップ』について書いていきたいと思います。

<参考文献>

プログラミングのための確率統計

プログラミングのための確率統計

のっけから測度論的なアイデア*6からの確率概念の説明がされています(そして、その説明の仕方がほとんど可能世界論的です)。書きぶりがとても面白くて親切で、個人的には確率統計の教科書としてとても大好きな本です。プログラミングはほとんど関係ないのに『プログラミングのための』という題名になっていることで読者が限定されてしまっている気がするのだけが残念です。本当に良い本だと思います。みんなこの本を読めばいいのにと思います。

応用のための 確率論入門

応用のための 確率論入門

ガチの測度論から導入される確率論の教科書です。こちらの本の語り口も大好きです(私は数学力不足のためこの本の前半部しか理解はできていませんが)。とはいえ、こういうガチの測度論から入る本に「入門」というタイトルを付けるのは読者のミスマッチの原因になるのでやめた方が良いなあとは思います*7。いわゆる初学者向けの入門書の類ではありません!

<参考サイト>

雑記2008年3月26日(水) - うつし世はゆめ / 夜のゆめもゆめ
at-akadaさんによる可能世界論と確率空間の読み替えについてのメモです。参考にさせていただきました。多謝です。



.

*1:できるだけちゃんとした説明となるように頑張りましたが、正直限界も感じています

*2:尚、本シリーズの内容については、論理学/分析哲学畑の共同研究者と共に細部を詰めた後に、総説論文等の形で発表することを予定しています

*3:確率の「内実」に関わる、主観確率や頻度的確率等々の考え方については次々回以降に説明していきます

*4:ただしEは完全加法性を満たすとする

*5:そんなん認めないやい!という見解も当然ありだとは思います

*6:測度論そのものが解説されているわけではないですが

*7:勘違いして買った人がAmazonに酷評レビューを載せてるのを見るのは全方位的に悲しい

確率概念について説明する(第2回):そもそも「可能である」とはどういうことか? — 可能世界論

どもっす。林岳彦です。さいきん軽い気持ちで某国際誌の総説論文の査読を引き受けたのですが、「どんな論文だろ?」と思いつつ査読対象の原稿をいざダウンロードしてみたら本文100頁アンド全体300頁もある超長尺の総説であることに気づき、「殺す気か!」「査読テロやで!」と思いました。

いやでもまじで300頁もレビューするの? この悲しみをどうすりゃいいの? 誰がぼくを救ってくれるの? この世はまさに大迷惑???

というかんじです。もう街のはずれでシュビドゥバーです。


いやもうホントに「レビュワー感謝の日」みたいの作ったほうが良いよね。


というわけで。


今回から、確率概念について説明していきたいと思います。

(今回も非常に長い記事になってしまいました。すみません。。。)


確率という概念の「規格」について、様相論理を経由して説明します

前回の今シリーズの概要説明の記事で書いたように、まずは、確率という概念の「規格」について説明していきたいと思います。

ここでの「規格」という語は、「概念としての確率」が持っている「要件」みたいなものを指しています。例えば、「確率は黄色である」「確率は150km/hである」という言い方は意味が通っていないですよね。つまり、確率概念は「色」でもなければ「時速」でもないわけです。

本記事では、ひとまずは『どのような要件を満たす〇〇のときに「確率は◯◯である」という文の意味が通るか』を考えることを通して、「確率とは何か?」についてじわじわと考えていきたいと思います。

ちなみに、一般的には、この問い(確率概念が持つべき「要件」)の答えとしては単純にコルモゴロフの確率の定理を引いて終わりにすることも多いか思いますが、本シリーズではより原理的に様相論理を経由しながらの説明をしていきます。

まずはなるべくボンヤリと:「確率」って「可能性を数値で表したもの」ですよね

まずはなるべくボンヤリと考えていきます。あ。先に言っておきますが、本シリーズの大方針としては、なるべく日常的なボンヤリとしたものから徐々にformalな形へと展開していく形で説明をしていきたいと思います。(「まずはなるべくボンヤリと考える」=「まずは大域的サーチから始める」というイメージです)

さて。なるべくボンヤリと「確率ってなんだろう」と考えてみましょう。わたしの場合、ボンヤリと考えた結果:

少なくとも、「確率」とは「可能性を数値で表したもの」

というのを先ずは思いつきました。まあ、ボンヤリと考えを巡らせるための出発点としては悪くないように思います。

はい。

ひとまず、確率は「可能性を数値で表したもの」であるとしましょう。さて。では、その「可能性」というものはいったい何なのでしょうか?

「可能である」とはそもそもどういうことか

さてさて。「可能性」とはいったい何でしょうか。

ちょっと途方もない問いのようにも思いますが、学問というのはありがたいものでひと通りの考え方が既に整理されていたりします。以下では、論理学/分析哲学における様相論理の考え方をベースに考えを進めていきたいと思います。


さて。ひとまず、「可能性」というのは「可能であるという性質」という意味であると考えられると思うので、ここではさらにそのコアを為す部分である:

可能である」とは何か

について考えていきます。

ここで、とりあえずの方針として、任意の事象Aについての:

「Aは可能である

という文について考えていきましょう・・・と思ったのですが、ここで抽象的に”A"と書いても我ながら余りにピンとこなかったので、より具体的な例をAに代入して:

「A = 2020年にブエノスアイレスに雪がふること」

という例を用いて考えを進めていきたいと思います*1

さてさて。ではでは:

「2020年にブエノスアイレスに雪がふることは可能である

という文において「可能である」というのは一体どういう意味なのかについて考えていきます。


まず上記の文に対応するものとして浮かぶのは「今までもブエノスアイレスに雪がふったことがある」という意味内容かもしれません。ふむふむ。これは良さそうです。

しかし、もしここで逆に考えを辿ってみると、「今までブエノスアイレスに雪がふったことがない」ならば、「2020年にブエノスアイレスに雪がふることは可能でない」ということになってしまいます。これは、そうとも言い切れないように思います。

というか、この論法が正しければ、「初めて起こること」は全て「可能である」ことの範囲に入らなくなってしまいます。(例えば、「今まで私がNatureに論文を載せたことがない」ことをもって、「私がNatureに論文を載せることは可能である」ということが論理的に否定されるかというと、そういうわけではありません・・・論理的には・・・)

逆から考えてみると考えやすそうなので、もう少し逆から考えてみましょう:

「2020年にブエノスアイレスに雪がふることは不可能である(=可能でない)」

とはどういう意味でしょうか?

これは、単に「今までブエノスアイレスに雪がふったことがない」ということだけではなさそうです。もっと意味内容として適切なのは:

いかなる場合・条件においても、2020年にブエノスアイレスに雪は降らない」

といった意味内容になるかと思います。これは、上記の文中の「不可能である」ということの意味内容にちゃんと対応しています(よね?)。

一方、ここからひるがえって、「2020年にブエノスアイレスに雪がふることは可能である」という文については:

「2020年にブエノスアイレスに雪が降るような場合・条件が少なくとも1つある

という意味内容を対応させることができます。これは、上記の文中の「可能である」ということの意味内容にちゃんと対応しています(よね?)。

はい。

ここでまとめとして一般的/抽象的な形式に戻しますと:

「Aは不可能である」=「いかなる場合・条件においてもAは真ではない」
「Aは可能である」=「Aが真であるような場合・条件が少なくとも1つある

と表すことができます。

ここまではよろしいでしょうか。

(*この辺りの議論をもっと厳密に行うためには、論理式を用いて考えることが必要となってきます。論理式を用いた説明については本記事末の参考文献をご参照ください)

可能世界という枠組みを導入する

はい。上記でボンヤリと考えてきた結果として:

「Aは不可能である」=「いかなる場合・条件においてもAは真ではない」
「Aは可能である」=「Aが真であるような場合・条件が少なくとも1つある

というところまで到達することができました。

ではここで満を持して、「可能世界possible worlds)」という言葉/枠組みを導入したいと思います。とはいえ大したことをするわけではなく、上記の「異なる場合・条件」という表現を「異なる場合・条件が成立している世界」という表現/枠組みで捉えていくだけです。

例えば、「2020年にブエノスアイレスに雪がふる」ことに関して「2019年の南半球の平均海水温」が重要な要因となっている場合を考えてみましょう。

ここで、「2019年の南半球の平均海水温が10度であるという条件において」という条件文を「2019年の南半球の平均海水温が10度である世界において」という表現/枠組みで捉えていくのが可能世界論のアプローチになります。(*注意*分析哲学/様相論理のプロから見てこの説明が妥当なのかは正直あまり自信がないです)

このとき、可能世界は無数に存在することができて、「2019年の南半球の平均海水温が10度である世界」「2019年の南半球の平均海水温が11度である世界」「2019年の南半球の平均海水温が12度である世界」「2019年の南半球の平均海水温が13度である世界」・・・などなどの諸「可能世界」が存在しうることになります。

もちろん、可能世界としては「平均海水温において異なる諸世界」だけではなく、他のあらゆる事項についての諸「可能世界」を考えることができます。


そのようなあらゆる事項についての諸「可能世界」が存在するという枠組みを用いると、「2020年にブエノスアイレスに雪がふることが可能である/不可能である」という文の意味内容を:

  • 「2020年にブエノスアイレスに雪がふることは不可能である」=「全ての可能世界において2020年にブエノスアイレスに雪はふらない」
  • 「2020年にブエノスアイレスに雪がふることは可能である」=「2020年にブエノスアイレスに雪がふる可能世界が少なくとも1つある

という「可能世界の集合」にもとづく枠組みにより表現することができます。

ついでに言うと「2020年にブエノスアイレスに雪がふることは必然である」というのは:

  • 「2020年にブエノスアイレスに雪がふることは必然である」=「全ての可能世界において2020年にブエノスアイレスに雪がふる」

と表すことができます。

可能世界論の枠組みに基づき「必然性」を表現すると、「全ての可能世界において真である」になるわけです。

さて。

以上で見てきた例は未来における可能世界の例ですが、現在や過去の例でも「可能世界」を考えることはできます。例えば、「2014年3月における日本の総理大臣が安倍晋三である」という可能世界も、「2014年3月における日本の総理大臣が菅直人である」という可能世界も考えることができます。この前者は「事実的世界(factual world)」であり*2、後者は「反事実的世界(counterfactual world)」と呼ばれるものになります。(ちなみに、統計的因果推論ではこの反事実的世界をどう捉えるのかが本質的なテーマとなっています→ 過去記事例1過去記事例2

また、可能世界としてはもっと荒唐無稽な世界も考えることができます。例えば、「ある朝に目を覚ましたときにあなたが巨大な虫になっている世界」や「この世界と全く同じ内容を持つが時間の流れだけが未来から過去へと進んでいる世界」も可能世界の1つとして考えることができます。

ただし、そのような荒唐無稽な世界まで考えた場合には、おおよそ言語で表現できるものはなんでも「可能」になってしまいそうなので、「私たちが居るこの世界(今後、「この現実世界@」と表記します)」の近傍の可能世界のことだけを考えることもあります。ここで、「近傍の可能世界」というのは、「この現実世界@」から大きく隔たらないような諸可能世界のことになります。例えば、「ある朝に目を覚ましたときにあなたが巨大な虫になっている」ことが真である世界というのは、「この現実世界@」とは異なる物理法則や生物的法則が支配している世界であると考えられるため、「この現実世界@」の「近傍の可能世界」とは言えないでしょう。

日常的用語としての「可能である」という句の用法をベースに考えることが目的であるならば、「この現実世界@」の近傍の世界に「可能世界」の範囲を定めるほうがよさそうです。(荒唐無稽な条件においてのみ成立する事象に対しては、我々は通常は「可能である」という語を用いないので)

このとき、「Aは不可能である/可能である/必然である」というのを一般的/抽象的な形でまとめると:

  • 「Aは不可能である」=「全ての(近傍の)可能世界においてAは偽である」
  • 「Aは可能である」=「Aが真である(近傍の)可能世界が少なくとも1つある
  • 「Aは必然である」=「全ての(近傍の)可能世界においてAは真である」

と表すことができます。上記での「近傍」というのは「この現実世界@」から見た場合のものになります。

このように、「可能である」ということについては、「この現実世界@」の近傍の可能世界の集合の枠組みにより表すことができるわけです。

まとめ

はい。というわけで、今回の記事では:

少なくとも、「確率」とは「可能性を数値で表したもの」

というボンヤリとした出発点から:

「可能である」ということについては、「この現実世界@」の近傍の可能世界の集合の枠組みにより表すことができる

というところまで到達することができました。

一応、今回の記事の内容をまとめておきましょう:

  • 可能世界論のアプローチでは「条件ZにおけるA」というのを「Zが成立する世界におけるA」と捉える
  • 可能世界は無数に存在しうる
  • 「この現実世界@」で真であることが真である可能世界は「事実的世界(factual world)」である
  • 「この現実世界@」で真であることが偽である可能世界は「反事実的世界(counterfactual world)」である
  • ちなみに統計的因果推論ではこの「反事実的世界」をどう捉えるのかが本質的なテーマである(過去記事例1過去記事例2
  • 「可能世界の集合」により「不可能性/可能性/必然性」を表すことができる
    • 「Aは不可能である」=「全ての可能世界においてAは偽である」
    • 「Aは可能である」=「Aが真である可能世界が少なくとも1つある」
    • 「Aは必然である」=「全ての可能世界においてAは真である」

はい。だいだいこんなかんじになるかと思います。


本シリーズの次回(第3回)では、「可能世界の集合における各可能世界の”面積”を数字で表す」というアプローチにより、可能世界論からコルモゴロフの確率の定理へのソフトランディングを試みていきたいと思います。

参考文献

今回の記事における様相論理/可能世界論の説明には不備があるかもしれないので、適宜以下の文献をご参照いただければと思います。何卒よろしくお願いいたします。

論理学をつくる

論理学をつくる

論理学一般のちょう分厚いテキストです。様相論理についても載っています。

可能世界の哲学―「存在」と「自己」を考える (NHKブックス)

可能世界の哲学―「存在」と「自己」を考える (NHKブックス)

可能世界論についての日本語で書かれた入門書です。この本を読んだことで私はこの路線に深入りしてしまいました。

多宇宙と輪廻転生―人間原理のパラドクス

多宇宙と輪廻転生―人間原理のパラドクス

さらに可能世界という考え方をこじらすとこんなふうになるという本です。素敵だと思います*3

*1:もちろんここで「ブエノスアイレス」という固有名の問題には深入りしませんがご容赦ください。さすがにそこに深入りするほどの勇気はないっす

*2:もし私とあなたが同一の「この世界」に居るのならば、ですが

*3:素敵という言葉と素数という言葉は近傍に存在すると思います

忘れるということがピンとこないことについて

どもです。林岳彦です。

前回の記事は深夜に書いていたのですが、投稿したときにちょうど日付けが変わって3月11日になっていて、何か書くべきかもと思ったのですがうまく考えがまとまらず、そのままになっていました。

そんな折、仙台在住の友人のブログを読んでたらああなんかすごくこの感じわかるわ、と思って気持ちが溢れてきてしまったのでそれをここに書き残しておきたいと思います。

そのブログ記事はこちら:
ES - 日々の散歩の折りに

上記の記事に触発されて、今回の記事は「忘れるということがピンとこないこと」を抱えながら生きている全ての人びとに向けて書いてみたいと思います。(うまく書けるかどうかよくわからないけど)

忘れるということがピンとこないということ

「忘れるということがピンとこない」というのがたとえばどういう感じなのか。上記の友人のブログを一部引用してみます(引用元):

ところでもう震災から3年が経とうとしているのだが、仙台に暮らしていると忘れることなんてない、と思うのだけれども、そうでもないと忘れられてしまうものなのだろうか。


まず普通に毎日「東日本大震災」という言葉を見たり聞いたりするわけだし、ふとした会話の中でも震災の話、というのはよく出てくるものである。だから最早生活の一部になってしまっているようなものなのだけれども、被災地でもなければそういうものでもないものなのだろうか。


私もあれから3年、もう所謂「普通の」生活に戻っている。津波被害とか建物の被害等がなかったから普通の生活に戻していくのは楽だったわけである。だから音楽を聴いたり仕事したりテレビを観たりラジオを聴いたり本を読んだり酒を飲んだりご飯を食べたりiPad買うかどうかで検討を重ねたり(結局買った)できているわけである。それでも毎日、ふとした瞬間に震災のことを思い出す。例えば車のガソリンが半分切ったらすぐに満タン入れたりするようになったのも明らかに震災の経験のせいであるわけで。


要は何と言うか色々なことの裏側にびっちりと「震災」が張り付いているような状態である。ちょっと表面の一部とかが剥げたり、継ぎ目の隙間あたりからすぐに震災が表れてくる、という。だからなんか「風化を防ぐ」、とか「忘れない」、とか言われてもピンと来ないものなのだけれども政治のありようとかテレビの番組での取り扱われ方とか見ていると、もしかしたら結構忘れられてしまいそうなことなのかな、とか思うようになった。

たとえばこういう感じです。この感じ、分かる人は分かるかと思います。分からない人は分からないかもしれません。

以下では、この「感じ」を私なりの表現で説明してみたいと思います*1

「本当に取り返しのつかないこと」による「この世界の条件付け」

うまく書けるかわかりませんが、説明してみます。

あなたに、"A"という「本当に取り返しのつかないこと」が起きたとしましょう。「本当に取り返しのつかないこと」とは、何らかの受け入れがたい原因によって、あるいはあなたにとってかけがえのないモノやコト、あるいは人の命が永遠に失なわれる ーーー たとえばそういうことです。

そのとき以降、あなたにとって「この世界」の在り方というものは:

p( この世界におけるx|本当に取り返しのつかないことA )

という形で映るようになるかもしれません。つまり、この世界における全てのxは、「本当に取り返しのつかないことAが起きたという条件付け」の下でしか存在しなくなるわけです。(以下、”A”について、あなたにとっての「本当に取り返しのつかないこと(恋人や子どもが亡くなる、など)」を想像して当てはめながら読んでみてください)

別の言い方をすると、この世界における全ての事象の可能性 ーーー 道を歩いたり、雲を見上げたり、コーヒーを飲んだり、同僚と喋ったり、恋人とキスをしたり、本を買ったり、ネットサーフィンをしたり ーーー そういった諸々の全てが、もはや「本当に取り返しのつかないことA が起きたという条件付け」の下でしか存在しえないということです。


これはある意味、論理的な話でもあります。

なぜなら、実際に「本当に取り返しのつかないことAが起きてしまった」のならば、この世界においては、もはや「本当に取り返しのつかないことAが起きた」という事実的条件付けからは逃れることはできないからです。

たとえあなたが北極へと逃げたとしても、銀河系の遠くかなたの星まで逃げたとしても、この世界において「本当に取り返しのつかないことAが起きてしまった」あとでは、最早この世界のどこをどう切り取っても「本当に取り返しのつかないことAが起きてしまった」という事実により既に条件付けされてしまっているのです。(金太郎飴のように)


「本当に取り返しのつかないことが起きてしまった」とき、多くの人は世界に対してこのような「感じ」を持つようになるのだと思います。

そもそも「忘れるということ」ができるもの、できないもの

本当に取り返しのつかないことが起きてしまい、この世界の在り方というものが:

p(この世界におけるx|本当に取り返しのつかないことA )

という形で映るようになってしまった人にとっては、「本当に取り返しのつかないことAが起きた」ことを「忘れるということ」がどういうことなのかよく分からなくなります。

なぜなら、そのような人にとっては「本当に取り返しのつかないことAが起きた」ことは「この世界が在る」ことそのものと最早区別がつかなくなってしまっているからです。


・・・このニュアンスを伝えるために、ポケモンのゲーム(RPGシリーズ)にたとえてみたいと思います。(ポケモンのゲームをやったことがない人には全く分からないたとえになるかもしれませんがすみません)

ポケモンのRPGシリーズのゲームでは、各ポケモンは4つまでワザを覚えることができるようになっています。もし、あるポケモンが既に4つのワザを覚えている場合には、新しいワザを覚えるためには現在覚えているワザの1つを忘れる必要があります。そして、もし一度ワザを忘れてしまえば、もうそのワザのことはそのポケモンの中でサッパリ消去されてしまいます。

さて。「"本当に取り返しのつかないことA"により条件付けられた世界に生きている人」が「Aが起きたこと」を忘れるというのは、このように「ポケモンがワザを忘れる」ようにはいきません。

ポケモンのRPGシリーズのゲームにたとえた場合には、「"本当に取り返しのつかないことA"により条件付けられた世界に生きている人」が「Aが起きたこと」を忘れるというのは、むしろ「ゲームの中のポケモン」が「ポケモンのゲームの世界」そのものを忘れるということに近いといえるでしょう。ゲームの世界内の存在である「ポケモン」が、「ゲームの世界そのものを忘れる」ことは可能なのかと考えていくと、そもそもこの場合において「忘れるということ」がどういうことなのかよく分からなくなってきます。


この「よく分からなさ」は、「"本当に取り返しのつかないことA"により条件付けられた世界に生きている人」にとって「Aが起きたことを忘れるということ」がそもそも「ピンとこない」ことにとても似ています。


「本当に取り返しのつかないことが起きてしまった」とき、「忘れるということがピンとこない」という人がいたら、その人が抱いているのはおそらく上記のような「感じ」ではないかと思います。

本当に取り返しのつかないことが起こるということ

繰り返し書いてきましたが、本当に取り返しのつかないことが起きたとき、それ以降、少なくない人々にとって世界の在り方は:

p(この世界におけるx|本当に取り返しのつかないことA )

のような、世界の全てが「本当に取り返しのつかないことA」により条件付けられたような形で映るようになるのではないかと思っています。


東日本大震災から3年たち、色々なものが徐々に「日常」に戻っていき、被災地以外の人々はポケモンが以前のワザを忘れるようにして震災のことも忘れていっているのかもしれません。

ただし少なくない人々にとって「世界の(条件付きの)在り方」は永遠に変わってしまったのだと思います。そして、世界の在り方そのものが変わったことは、原理的に言って「忘れ」たり「乗り越え」たりできるようなものではないように思います*2


だからどうすればいいということを言えるわけでもないのですが


私は「この世界」に残り、その結果として今この文章を書いています。



.

*1:説明の中で上記の記事のニュアンスとはもしかして違ってしまうかもしれませんが

*2:逆に、それを「心の傷」とベタに呼んでしまうのも少し違うように思います

確率概念について説明する(第1回):説明全体の構成 --- 確率概念の「規格」と「意味」

どもです。林岳彦です。白泉社文庫の大島弓子作品から一冊選ぶなら『つるばらつるばら』だと思います*1


さて。

今回からは長期のシリーズとして、「確率概念とは何か」についてガッツリと説明していきたいと思います。今回は、その第一回目として、「本シリーズにおける説明の全体構成(予定)」について書いていきます。

本シリーズでは確率概念の「規格」と「意味」について書いていきます

ざっくり言いますと、本シリーズの目的は「確率って何すか?」という問いに答えることです。

で、「確率って何すか?」という問いには以下の:

  1. 確率概念とはどのような「規格」をもった概念なのか?
  2. 確率の値(たとえば”0.5")は実際問題としてどういう内実的な「意味」を示しているのか?

という方向性のちがう2つの問いが含まれていたりします。

前者の(1)については、たとえば、「確率は黄色である」「確率は150km/hである」という言い方は意味として成り立たないですよね。

つまり、確率概念は「色」でもなければ「時速」でもないわけです。じゃあ「確率は◯◯である」という文においてどういう「用件/規格」を満たす◯◯なら「確率」と呼べるのか、という方向から「確率って何すか?」という問いに答えていくのが(1)への答えの方向性になります*2

一方、後者の(2)については、たとえば:

  • コインを投げてオモテが出る確率が「0.5」
  • 既に投げ終えたコインの上面がオモテである確率が「0.5」
  • 20年後に地球の平均気温が2度上昇している確率が「0.5」
  • 広島カープが今年優勝する確率が「0.5」

といったときに、いったいその「0.5」というのはどういう事態を指し示しているのか、その「0.5という値」の内実的な意味は何なのか、という問いに答えていくのが(2)への答えの方向性になります*3

まとめ:今回のシリーズのもくじ

さて。

上記のような「確率って何すか?」という問いにおける「規格」と「意味」の違いというのを念頭に置きつつ、今回のシリーズは以下のような構成で書いていく予定です。

  1. 説明全体の概要 — 確率概念の「規格」と「意味」 ←イマココ
  2. そもそも「可能である」とはどういうことか? — 可能世界論
  3. 可能な世界の全体を1とする — コルモゴロフによる確率の定理
  4. 可能な世界を数える — 論理確率
  5. 可能な世界へ賭ける — 認識論的確率
  6. もしも世界が永遠に続くなら — 頻度論的確率
  7. 私は間主観確率主義者である


実は以前も同じような目次まで書いてそのあとすっかり放置してしまったので、今回こそはこつこつとコンスタントに書いていきたいと思います。


なによろです

参考文献

論理学をつくる

論理学をつくる

本シリーズの記事を書くための下勉強として隙を見てはこの本を読んでいるのですが、いかんせん長すぎて(433ページ)記事が全然書けなくなりました。。。まさに本末転倒です。でも良い本だと思います。

つるばらつるばら (白泉社文庫)

つるばらつるばら (白泉社文庫)

確率のことを思い出すと可能世界のことを思い出すと神のことを思い出すと大島弓子の作品を思い出します。

*1:『夏の夜の獏』とか、ほんともう!

*2:この問いについてはふつうはコルモゴロフの確率の定理を引いてFAなのですが、本シリーズではより原理的に様相論理から説明を始めていきます

*3:この問いについてはふつうに「古典的確率/論理確率」「認識論的確率(主観確率)/間主観確率」「頻度論的確率」といった代表的な概念を説明していくことになります

発表資料アプ:世界における疾病および死亡リスク要因の定量化(GBD Study 2010 in Lancetの論文紹介)

こんにちは。林岳彦@はてなジェシ(フロンターレの生命線)です。

さて。

先日、某勉強会で論文(Lim et al. 2012 in Lancet)の紹介をしたのでついでに発表スライドをアプしてみました。論文の内容は、簡単に言うと「世界の健康リスク要因のランキングを作ってみた」というものです。

詳しい説明は以下のスライドをご参照ください。図表が小さいですが、細かいところまで見たい方はリンク先よりスライドのPDFをダウンロードして拡大して見ていただければと思います。あくまで口頭での説明を前提とした発表ファイルなので、これだけを見てもわけが分からないかもしれませんが、例えばFig2とかFig5とかのリスク要因のランキングを見るだけでも「へえ」というかんじで面白いかもしれません。



ちなみに元論文はこちら↓
A comparative risk assessment of burden of disease and injury attributable to 67 risk factors and risk factor clusters in 21 regions, 1990–2010: a systematic analysis for the Global Burden of Disease Study 2010 : The Lancet

ちなみに元論文が載ったGBD study特集号はこちら↓
The Lancet : Volume 380, Number 9859, 15 December 2012

なぜリスク分析のプロは仮説検定を使わないのか(ややマニア向け)

お久しぶりです。林岳彦です。もうすぐ『愛なき世界』の日、いわゆる(マイブラッディ)バレンタインデーですね。何かと雑音が多いこの世界ですが、いつでも自分の足元を見つめて行きましょう。


さて。


今回は、以下の:

のあたりの皆様の良記事に触発されて「仮説検定」について何か書いてみようと思いました。で、書こうと思えば色々な側面から書ける気もするのですが、今回はちょっと斜めからのアプローチとして、「リスク分析の人の頭のなかで仮説検定はこんな感じに見えている」というところを書いていきたいと思います。

ここで、ひとくちに「リスク分析」と言っても思い浮かべるところは人それぞれかもしれませんが、今回は以下の:

入門リスク分析―基礎から実践

入門リスク分析―基礎から実践

に載っているような「確率論的リスク分析手法」を用いるアプローチ一般を指して「リスク分析」という言葉を使っていきます*1


では、つらつらと書いていきたいと思います。

(今回もとても長いです。いつもすみません。。。あと、今回とくに一部内容に余り自信がないので*2、もし間違ってたら適宜ツッコミおねがいいたします)


前置き:リスク分析では仮説検定は殆ど使わなかったりします

さて。

もしかしたら意外に思う方もいるのかもしれませんが、「リスク分析」においては仮説検定を使うことは殆どありません。私も一応リスク分析に類する論文を何報か書いていますが(論文へのリンク)、それらの論文の中で仮説検定を用いたことは一度もありません*3

これは単に私が個人的に仮説検定を使わないという話ではなく、例えば、冒頭に挙げたDavid Vose著の『入門リスク分析』の中でも仮説検定の話はほんの僅かしか出てきません*4。これは、そもそも「リスク分析」のツールボックスの中に「仮説検定」が基本的に含まれていないことを意味しています。


では、なぜリスク分析においては仮説検定が殆ど使われないのでしょうか?

なぜリスク分析においては仮説検定は使われないのか:本来的な理由と技術的な理由

リスク分析において仮説検定が殆ど使われない理由としては、本来的なものと技術的なものの2通りの理由があります。

まずは、本来的な理由の方から説明してみましょう。


本来的に、「リスク分析」とは、リスク(=影響と不確実性の在りよう)を推定し、意思決定者の参考となる情報を提供することが基本的な目的です。つまり、「意思決定支援」こそがリスク分析の本懐であるわけです。

ここで、「仮説検定」がリスク分析と本来的に相性が悪いところは、仮説検定が「意思決定の自動代行機能」の側面を持っているところです。つまり、リスク分析の目的が「意思決定支援」であるにもかかわらず、仮説検定は仮説の採択に関して論点を先取りして肝心の「意思決定」をオートマティックに代行してしまう*5側面があり、この性質は「リスク分析のツール」としてはとても悪質なものであると言えます(→参考:具体的な弊害についての過去記事)。


もう一つの、技術的な理由の方は、リスク分析では推定の不確実性を見るときに基本的に「不確実性の分布全体を見る」ので、仮説検定がそもそも不要であることです。

さて。

本記事では以下、この「不確実性の分布全体を見る」ということについて、例を交えつつ説明していきたいと思います。

「不確実性の分布全体を見る」とはどういうことか:ブリの新エサを仮想例として

では、「不確実性の分布全体を見る」とはどういうことなのかを見て行きます。

説明のための仮想例として、「ブリの養殖業」における、ブリをより大きく育てるための「新エサの開発」についてのケースを考えてみましょう。

天然ブリ 1本-6kg前後

天然ブリ 1本-6kg前後


あなたはブリの養殖業を営んでおり、ブリを大きく育てるための新エサを開発しているとします。そして実際に、その新エサの効果を調べるために、新エサを用いて1群のブリを育てているとします。

ある日、新エサで飼育した1群のブリの中から、30匹をランダムに選んでその体長を測ってみた結果、以下のヒストグラムが得られました(以下は対応するRスクリプト):

# 30匹のサンプルの体長データ 
buri_length_30samples.v <-
  c(93.603192838865, 105.754649863331, 90.4655708138493, 126.929212032067,
  107.94261657723, 90.6929742382298, 110.311435786427, 114.074870576938,
  111.636720274802, 98.4191741926547, 125.676717526763, 108.847648546171,
  93.6813912918729, 69.7795016923375, 119.873963772147, 102.325995864772,
  102.757146053516, 117.157543160279, 115.318317926471, 111.908519818263,
  116.784660574123, 114.732044510966, 104.118474750478, 73.1597245620494,
  112.297386218421, 102.158068907065, 100.66306739942, 80.9387142415109,
  95.8277491733707, 109.269123402996)
# 散布図をプロット
plot(buri_length_30samples.v,col="royalblue",lwd=3,ylim=c(60,140))
# ヒストグラムをプロット
require(MASS)
truehist(buri_length_30samples.v,h=5,col="royalblue",prob=F) 
f:id:takehiko-i-hayashi:20140211002415p:plain:w400

この図は、サンプルした30匹のブリの体長のヒストグラムを表しています。この図から、体長には70cm〜130cmほどのバラツキがあり、平均は100cm〜110cm程度であることが見て取れます。


ここで話を単純化するため、「従来のエサ」で育てた場合の平均体長が「100cm」であることが既に知られていると仮定します。(また、エサの違いは体長の分散に影響を与えないと仮定します)

このとき、「従来の餌と比べた場合」の新エサの体長への影響の指標は、「新エサで育てたブリの体長」から、従来の餌による平均体長である「100cm」を差し引くことにより得ることができるでしょう。(単に、上図の横軸が100cmぶん左側へずれるだけですが)一応、そのヒストグラムを描いてみると:

# 新エサの体長データから100引いたものをweight_diff.vに格納
weight_diff.v <-  buri_length_30samples.v - 100
#「従来の餌との差」をプロット 
truehist(weight_diff.v,h=5,col="royalblue",prob=F) 
# 体長変化の平均値を算出
mean(weight_diff.v)
f:id:takehiko-i-hayashi:20140211003405p:plain:w400

となります。図を見ると、分布の全体はゼロよりも若干右側に重心があるようにも見えます。「ゼロより右側が多い」ということは、従来のエサに比べて、「新エサは体長をプラス方向に変化させる傾向がある」ということになります。

ここで、上の30匹の体長の変化分の平均を計算すると「+4.23cm」という値が得られました。ここでもういっそのこと「新エサの方が従来の餌よりも体長を大きくする」ということでOK・・・と結論してしまいたいところですが、これはあくまでも30匹のサンプルから得られた「サンプルの平均値」であるため、この程度の差はたまたまの偶然により生じている可能性も否定できません。ここで、本当に新エサが「どのていど体長を増加させると期待できるのか」を判断する際には、限られたサンプルから「サンプル元の集団における平均値」を推定する際に生じる「不確実性」を考慮する必要があります。

(以下、煩雑さを避けるために「サンプル元の集団における平均値の推定」のことを単に「平均値の推定」と略記していきますが、推定している対象はあくまでもサンプル元の集団における平均値であることにご留意ください)


さて。このような、限られたサンプルからサンプル元の集団における値を推定する際の「不確実性」を取り扱うためのよく知られた方法の一つは仮説検定です。しかし、今回はいわゆる「リスク分析」っぽいアプローチを用いてこの「不確実性」を取り扱ってみたいと思います。

ブートストラップ法により「平均値の推定における不確実性」を分布として描いてみよう

はい。

とは言っても、そんなに特別なことをするわけでもありません。

確率論的リスク分析においては、「推定に伴う不確実性」を可能なかぎり常に「分布の形」で取り扱っていきます。実務的には、そのための手法には大きく分けて「ブートストラップ法」と「ベイズ法」の2つのやり方があります。今回は、比較的とっつきやすい手法として「ブートストラップ法」の方を使っていきます*6

ブートストラップ法というのは:

  • (1) 現在得られているサンプル(今回の例の場合、30匹のブリの体長データ)から再び無作為に重複を許しながら値をサンプリングすることにより、新たな「サンプル」(今回の場合、新たな「30匹分のデータ」)を生成し、その「新たなサンプル」に基づき統計量(今回の場合、平均値)の推定値を計算する
  • (2) (1)の計算をものすごくたくさん繰り返すことにより、ものすごくたくさんの数の統計量の推定値を算出し、その推定値の分布全体を得る

という方法です。(なんのこっちゃかよく分からない方は、基礎統計学講座@ウィキフリーソフトによるデータ解析・マイニング奥村晴彦さんの記事のあたりの良記事をオススメいたします)

まあ案ずるより産むが易しということで、とりあえずやってみます*7。対応するRのコードは例えば:

### ブートストラップ(反復数50000)による平均値の推定分布の算出
# ベクトルの初期化
mean_bootstrap.v<- numeric(50000)
# ブートストラップ(反復50000回) 
for(i in 1:50000){
     # "新”サンプルを最初のサンプルからリサンプリング
     bs <- sample(weight_diff.v,30,replace = TRUE)
     # “新”サンプルの平均値を算出しmean_bootstrap.vに格納
     mean_bootstrap.v[i] <- mean(bs)
}
# 平均値の推定分布を描く
truehist(mean_bootstrap.v,h=0.5,col="royalblue") 

となります*8。このブートストラップの計算では、「ブリの体長データそのもの」ではなく「従来のエサと比べた場合の変化量(つまり「体長データ」から100cmを差し引いたもの)」を用いています。

ブートストラップの結果として、以下のような「従来のエサと比べた場合の変化量」の推定された平均値の分布(ヒストグラム)が得られます:

f:id:takehiko-i-hayashi:20140211005131p:plain:w400

はい。この分布が、「新エサが体長に与える変化の平均値の推定に伴う不確実性」を「分布の形」で表したものになります。確率論的リスク分析においては、推定に伴う不確実性をこのような分布の形で扱うことが一般的です。

(一般論として、このような分布が何を意味しているのかというと、例えば、この分布の「幅」は推定の「精度」を表していることになります。もし30匹よりも少ないサンプルに基づきこのような分布を描けば「より幅の広い分布」が得られますし、30匹よりもずっと多数のサンプルに基づけば「より幅の狭い分布」が得られることになります)


さてさて。では、リスク分析においてこのようなやり方で不確実性を扱うことのメリットとは一体何でしょうか。その主なメリットは、「推定の不確実性」の二次利用のしやすさにあります。

不確実性を「分布の形」で保持しておくことの利点を見てみる

はい。

推定における不確実性を上記のような「分布の形」で保持しておくと、その分布データを意思決定支援のための新たな解析に簡単に供することができるというメリットが生じます。

・・・と言われてもにわかには何のことか分からないとは思いますので、上記の解析を用いて、意思決定において非常に重要な項目であると思われる「ブリの売価」がどう変化するかについての新たな解析例を展開してみましょう。

解析例としての仮定として、生産したブリの売値(100匹当り)は『「ブリの平均体長の3/2乗」の1000倍』、つまり以下の式*9

「売値」 = 1000 × ((ブリの平均体長) ^ (3/2))

で表せることが知られているとします*10

従来のエサで育てた場合には、仮定により平均体長は「100cm」なので、この式より「売価」はちょうど 1000 × (100 ^ (3/2)) = 1,000,000円(100匹当り)になると計算できます。

同様に、新エサを与えた場合の「売値」は:

「売値」 = 1000 ×((100 + 新エサによる体長変化の平均値) ^(3/2))

と計算することができるでしょう。

ここで、「新エサによる体長変化の平均値」の推定の不確実性を前述のような「分布の形」で保持している場合には、その分布を表す数値データ群を「新エサによる体長変化」の値としてそのまま代入してやることにより、体長変化に関する推定の不確実性の影響込みでの「新エサで育てた場合の売値」の予測分布をすぐに算出することができます。

試しにRで計算してみましょう:

# ブートストラップによる推測分布を代入しつつ売値の予測分布を算出する
price.v <- 1000 * ((100 + mean_bootstrap.v)^(3/2))
# 売値の予測分布のヒストグラムを描く
truehist(price.v,h=5000,col="orange")
# 売値の予測の平均値
mean(price.v)
# 売値が1,000,000円となるパーセンタイルの算出
ecdf(price.v)(1000000) 
f:id:takehiko-i-hayashi:20140211010241p:plain:w430

計算の結果として、上図のような「新エサで育てた場合の売値」の予想分布が得られます。

この予想分布がどのように「意思決定を支援」しうるかを見てみましょう。

まず、上図の予想売価の平均値を算出すると「1,064,406円」となり、従来の売価が「1,000,000円」なので、新しいエサによる100匹当りの追加コストが「+64,406円」のところが(新エサの効果推定に伴う不確実性の下での)新エサ導入の"損益分岐点"になると計算できます。

また、売価が従来のエサと同じ「1,000,000円」となるのは分布の4.8パーセンタイルのところであるため、新エサの効果推定に伴う「不確実性」を考慮に入れた場合には、売価が従来のエサのものを下回ってしまうリスクも依然5%程度はあることがわかります。


はい。

こんなかんじで統計的推定に伴う不確実性の分布を「二次利用」していくのがいわゆる「リスク分析」っぽい解析アプローチとなります。このように、もともとの「データ(今回の場合は新エサによる体長データ)」のコンテクストを、より意思決定に直接的に関連するコンテクスト(今回の場合は「売値」の予測分布)へとできるだけ定量的に繋ぐための解析を行うことがリスク分析の基本的なミッションになります*11


さて。

とは言っても、場合によってはリスク分析においても(主に説明のための便宜として)、「仮説検定」や「信頼区間」のような計算が求められることもあります。次は、不確実性の「分布」がそれらの古典的な統計的概念とどういう関係にあるのかを見ていきます。

不確実性の「分布の形」での取り扱いは「仮説検定」「信頼区間」の上位互換である

不確実性の「分布」と「仮説検定」「信頼区間」の関連性は、図で見ると分かりやすいので図に描いてみます:

f:id:takehiko-i-hayashi:20140211231915p:plain:w500

この図は上述のブートストラップ法で算出した「新エサによる体調変化の平均値」の推定値の分布に、「仮説検定」や「信頼区間」との関係の説明を書き込んだものです。この図を使って説明をしていきます。

まず、上図(B)の場合である「信頼区間」を見ていきます。推定値の分布と信頼区間との関連性はシンプルで、いわゆる95%信頼区間というのは推定値の分布の2.5パーセンタイル*12と97.5パーセンタイルの値に挟まれる範囲を意味します。

実際にRで推定分布から計算すると:

# 95%信頼区間の計算
quantile(mean_bs.v,p=c(0.025,0.975))

2.5% 97.5%

  • 0.8022501 8.9183979

として95%信頼区間 [-0.80 〜 +8.9 ]を簡単に計算することができます。(このようにブートストラップ法で計算された信頼区間を特に「ブートストラップ信頼区間」と呼ぶこともあります→参考:基礎統計学講座@ウィキ, hoxo_mさんの記事


また、上図(A)の仮説検定との関連に関しては、上記の95%信頼区間が「ゼロをまたぐ」ことから、「新エサによる変化の平均値はゼロと異ならない」という仮説を棄却することができない、という5%有意水準を念頭においた仮説検定的な判断を行うことも可能です。

(*補足:ここでなぜ仮説検定”的”という言い方をわざわざしているかと言うと、いわゆる「仮説検定」は帰無仮説が正しいという仮定のもとで生成された統計量の分布のもとで、実際に得られているサンプルからの統計量を評価するというロジックで行うので、上記の例のように(帰無仮説ではなく)実際に得られているサンプルの統計量の分布をもとにした判断を「仮説検定」と呼ぶのは適切ではないと思われるからです*13。ただし、帰無仮説のもとでの統計量分布に基づき考えるのも、得られているサンプルからの信頼区間に基づき考えるのも、見ようとしている先のものは実質的には殆ど同じです(が、比較対象先の値自体もまた推測値である場合には、「2つの推測値の分布」の重なりを考える必要があるので注意が必要です→参考:「馬車馬のように」の記事, kamedo2さんの記事

同様に、もし「新エサによる変化の平均値がゼロより大きいと言えるかどうか」の判断を5%有意水準を念頭においた(片側)仮説検定的に行う場合には、5%信頼下限値(=分布の5パーセンタイル値)より上の区間がゼロを含むかどうかにより判断を行うことも可能です。(今回の例では推定値の分布の5パーセンタイル値は「0.039」というゼロより大きい数値になり、5%信頼下限値より上の区間にはゼロを含まないことになるので「新エサによる変化の平均値はゼロよりも大きい」と判断することができます)


はい。

このように、解析を通じて不確実性を「分布の形」で保持してさえいれば、信頼区間や仮説検定的な解析もニーズに応じて簡単に行うことができます。このため、リスク分析では不確実性を「分布の形」で取り扱うやり方がデフォルトとして好まれる一方で、仮説検定に関するエトセトラには余り本来的に興味が持たれない、ということになります。


(喩えて言うと、不確実性を「分布の形」で取り扱うことを志向することは、魚を「一本まるごと」取り扱うことを志向することに似ていると言えます。魚を「一本まるごと」保持しておけば、必要に応じて「信頼区間(さく切り)」や「仮説検定(切り身)」の形に加工することは容易ですが、不確実性を最初から「信頼区間(さく切り)」や「仮説検定(切り身)」の状態にしてしまうと、それらに向いた用途以外への二次加工(あら煮とか)を行うのが難しくなり、意思決定支援のコンテクストに沿った解析の可能性の幅をあらかじめ大きく狭めてしまう危険性があるのです)


まとめます

では、今回の記事の内容をまとめます:

  • リスク分析では仮説検定をあまり使わない
  • その理由のひとつは、リスク分析の目的が「意思決定支援」なのに仮説検定の野郎はそれを勝手に代行しがちだから
  • リスク分析では不確実性を「分布の形」で取り扱うことを好む
  • 不確実性を「分布の形」で取り扱うと「不確実性の二次利用」が捗る
  • 「分布の形」で取り扱うのは「信頼区間」「仮説検定」による解析の上位互換とも言える
  • そのためリスク分析のプロは仮説検定に本来的に興味がない

はい。こんなかんじになるかと思います。


で、少し補足しておきますと、この記事を通して私が言いたいのは「何がなんでも不確実性を扱うときは分布で扱え」ということではありません

どちらかと言うと、「不確実性をどのように扱ってもいいけれど、アタマの中のイメージとしては常にどっかで「分布の形」を想像しておくべし」ということが伝えたいことです。なんというか、不確実性について「分布のイメージ」を持っている人がそれを「仮説検定」や「信頼区間」の言葉に変換するのは容易ですが、仮説検定のp値しか気にしてない人がそれを分布のイメージに翻訳するのは難しいので、実際の解析法として何を使うかはともかくとしても、「分布のイメージ」を常にアタマの中にもっておくことが大事かと思います。

実務的にも、例えば、リスク分析においては「分布のかなり端っこの部分が特に重要」だったり「推定分布が多峰型」だったりすることもありますので、そんなときに「分布の形」を無視して信頼区間だけで解析しようとすると痛い目にあうので注意が必要です。このような場合も不確実性についての「分布のイメージ」がアタマに入っていると地雷を避けることができるかと思います。


で、ついでにもう一件補足しておきますと、「意思決定支援」が本懐であるのは何もリスク分析だけではなく、ビジネス畑の「データサイエンティスト」の方々の中にもそのような方々が多くおられるのでないかと推測しております。さいきんわたくしも

データサイエンティスト養成読本 [ビッグデータ時代のビジネスを支えるデータ分析力が身につく! ] (Software Design plus)

データサイエンティスト養成読本 [ビッグデータ時代のビジネスを支えるデータ分析力が身につく! ] (Software Design plus)

  • 作者: 佐藤洋行,原田博植,下田倫大,大成弘子,奥野晃裕,中川帝人,橋本武彦,里洋平,和田計也,早川敦士,倉橋一成
  • 出版社/メーカー: 技術評論社
  • 発売日: 2013/08/08
  • メディア: 大型本
  • この商品を含むブログ (11件) を見る

という良書を拝読させていただき大変勉強になったのですが、この中に今回示したような「リスク分析」、つまり「データ解析」の結果を二次利用してさらなる解析を行い、意思決定により密接に関連するコンテクストにおける指標への影響を提示しうるような、そんな解析アプローチも載っていても良いのではなかろうか、という感想を抱きました。

スーパーで出来合いの「切り身」を買ってくるようなデータサイエンティストではなく、クライアントのニーズに沿って魚を一本まるごといかようにでも捌ける「寿司屋の大将」のようなデータサイエンティストを目指すのならば、そんな「リスク分析という包丁」も一つ持ってると身を助くこともあるのかも、とか思ったりする今日このごろです(←無責任)。


で、もし、本記事がそのような「寿司屋の大将」への入り口となりうればとても嬉しいと思っております。


# 「リスク分析」をもっと知りたい方にはこちらをオススメいたします↓

入門リスク分析―基礎から実践

入門リスク分析―基礎から実践

(ちなみにわたくし、この本は「ベイズ統計入門」としてもベストと言っても良いかもしれないと密かに思っております)

Appendix:今回参考にさせていただいた記事のリスト(多謝)

仮説検定関連:

ブートストラップ関連:

信頼区間関連:

Rによるベイズ解析(MCMC)の実装関連:

あんまり関係ないかもですがリスク分析における「変動性」と「不確実性」について自分で昔に書いた記事:

*1:なので、もし読んでいて違和感がある場合には、「リスク分析」を「確率論的リスク分析」に適宜置き換えて読んでいただければと思います

*2:特に古典的な「統計学」に関するところが苦手です

*3:文献からの既往データとして仮説検定からの結果を(仕方なく)使うことはあります

*4:本書の全567ページ中で仮説検定の話が出てくるのは僅か10ページほどで、しかも内容は分布モデルの選択の文脈での適合度検定の話なので、本来なら仮説検定よりもAICを使うべき部分になります

*5:あるいは、代行しうると多くの人にみなされている

*6:ベイズ法についての例はたとえば→ tjoさんの記事

*7:まあ30匹程度でブートストラップやるのは精度が低いかもですが今回はその辺はあまり気にせずにやっていきます

*8:実装のコードはいろいろ方法はありますが、今回はsample関数を使いました。分布の形状が綺麗になるように多めに50000回の反復をさせています

*9:すみません。この式はテキトーに考えたもので特に意味はありません

*10:説明の単純化のため、ブリの体長の分散の影響と、この関係式自体に関する不確実性は無視できるものと仮定します

*11:今回の例は説明のためかなり単純化していますが、実際には多数のコンテクストからの多数のパラメータが絡み合う複雑な解析になることももちろんあります

*12:xパーセンタイル = 小さい方から数えて全体のx%目の順番に相当する値

*13:あんまりこのへん自信ない