Take a Risk:林岳彦の研究メモ

自らの研究に関連するエトセトラについてのメモ的ブログです。主にリスク学と統計学を扱っています。

フィッシャーの「統計的方法と科学的推論」の訳者解説が素晴らしすぎる(その1)

本編の方はフィデューシャル推測の項まで書いたのでもう良いかなあ、と思って終わりにして、今回から同書の「素晴らしすぎる訳者解説」のメモを書いていきます。

訳者の方は「渋谷政昭・竹内啓」さんなのですが、巻末の訳者解説が本当に素晴らしく完成度が高いのです。「池上彰か!」とツッコミたくなるくらいその解説は分かりやすく明確です。

こんな素晴らしい解説文が絶版により埋もれてしまうのは大きな文化的損失ですので、本来ならば全文引用したいところですが、色々な事情もありますので、フィデューシャル推測に関する部分だけを引用していきます。とはいっても長いので何回かに分けて見ていきます(かなり長丁場のシリーズになるかもしれません)。

同書201pの第3節の部分から引用していきます:

統計的推測の問題をはっきりさせるために、一つの例をあげて説明しよう。

今あるものの長さを測って、75.8cm、75.9cm、75.2cm、75.0cm、75.6cmという5個の値をえたとしよう。この場合測定値はいずれも互いに独立に、平均が真の値に等しく、標準偏差の正規分布をすることがわかっているとする。これらの測定値から真の値をどのように推定したらよいであろうか。これに対して、すぐに


標本平均=(75.8+75.9+75.2+75.0+75.6)/5=75.5cm


が”一番よい”推定値であると答えられるかもしれない。しかしそれはなぜ”一番よい”のか、なぜたとえば、標本中央値=75.6cmより”よい”のであろうか。この場合真の値はわかっていないのだから、それはたとえば75.7cmであるかもしれない。真の値が75.7cmであったとしても、上のような測定値の組が得られることは可能である。したがって75.5cmという値が、75.6cmという値より真の値に近いといい切ることはできないはずである。

ここでは”一番よい推定を行う形式”が必ずしも一義的に定まるものではないことが語られています。

続き:

これに対して、なるほど必ず平均値の方が中央値より真の値に近くなるとはいえないが、標本平均値の方は真の値のまわりに分散0.3^2/5(cm^2)、標本中央値は分散約(0.3^2/5)*1.45(cm^2)の分布をするから、平均値の方が、中央値より真の値の近くに来る可能性(確率)が大きい。だから平均値75.5cmは中央値75.6cmより”多分”正確である。というように答えても、それは答えにはなっていない。標本平均値と標本中心値の分布云々は、一般に5個の観測値を表す確率変数をX_1,X_2,X_3,X_4,X_5と表すとき、


\bar{X}=[\frac{X_1+X_2+X_3+X_4+X_5}{5}
\tilde{X}=med(X_1,X_2,X_3,X_4,X_5)


という形で定義される確率変数\bar{X}, \tilde{X}を考えたときに、その分布についてのべているのである。すなわち5個の観測値を繰返し何組も得たとき、それらからそれぞれ計算される\bar{X}および\tilde{X}の頻度分布を比較すると、たとえば\bar{X}の方が真の値の近くに集まるということである。ところで75.5cmおよび75.6cmという値は、この確率変数\bar{X}および\tilde{X}の一つの実現値にすぎない。それゆれその値がそれぞれの頻度分布のどの位置にあるかわからない限り、(真の値がわからなければ、それはわからない)この二つの値のどちらが真の値に近いかは、何もいうことができないことになる。

実際に我々が手にする標本平均値や標本中央値は、特定のサンプルから得られた一つの実現値に過ぎないわけですよね。そのことをどう解釈すればよいのか。

続き:

それではこの問題をどのように考えればよいか。それについて三つの考え方がある。一つがフィッシャーの”推論”の立場であり、一つはネイマンの”決定”の立場、そうして今一つは事前確率を用いるいわゆる”ベイズ流”の立場である。

なるほど明快。ちなみに本訳書の発行は1962年です。今後の引用を見ていくと、60年代初頭における日本人統計学者のベイズ*1というのも垣間見れてそちらも興味深いです。

続き:

フィッシャーの考え方は次の通りである。なるほど実際に75.5cmという値が75.6cmという値より真の値に近いかどうかはわからない。しかし平均値が中央値より平均的には真の値に近くなる以上、この場合われわれは真の値を”知らない”のだから、75.5cmという値が75.6cmという値より真の値に”多分”近いだろうと想像することは合理的である。すなわち75.5cmという推定値が”より正確な”推定値であるといってもよい。この点をさらにくわしく考えると、フィッシャーの推測確率*2の概念に結びつくが、それは後にのべる。

なるほど。ではネイマンは?

これに対してネイマンは、このように特定の推定値75.5cmと75.6cmを比較しようとすること自体が無意味であると主張する。真の値はわれわれがそれを知らなくてもただ一つ定まっているのだから、75.5cmという値は75.6cmという値より真の値に近いか、近くないかのどちらかである。その中間はない。”多分”とか”確率的に”とかいうことはない。もし確率でいうなら、75.5cmが75.6cmという値より真の値に近いということは、それが正しければ確率1, 誤りならば確率0である。

おお。いわゆるゴリゴリの”頻度主義者的解釈”ですね。

続き:

ネイマンの考え方に従えば、実はわれわれの問題とすべきことは、このような個々の推定量の具体的な実現値の精度ではない。確率変数の組が与えられたとき、それから推定値として平均値をとることにするか、中央値をとることにするか、という推定方式の比較が、そうしてそれのみが問題である。個々の推定値については、真の値に近いこともあり、遠いこともあろうが、それぞれの一つ一つの値でなく、このような推定方式を適応したときに得られる推定値の平均的な性質だけが問題である。そうして数学的な確率の概念は、このような平均的な性質についてのみ厳密に展開できるのである。個々の値について”多分”75.5cmの方が75.6cmより真の値に近いであろうとのべるようなことは、主観的な”感じ”を表しているだけであって、それは客観的科学的な根拠をもたないという。これに対してフィッシャーは、科学者が興味を持つのは、実際の観測値から得られた具体的な数値であって、同じ母集団に固定的に同一の推定方式を繰り返して得られる推定値の集団というような架空の存在は、意味をもたないと反撃している。

ネイマンは「方法論」しか議論の対象としないということですね。そこにフィッシャーとの論点の対立があるわけです。次はベイズについて。

続き:

第3の考え方は、いわゆる母数、この場合には母平均の真の値について事前分布を想定して、それからベイズの定理を適用して母数の事後分布を求めるという方法をとる。この場合事前分布として、ベイズあるいはラプラスのように恣意的に一様分布を仮定することは問題である。しかしベイズ流の立場をとる人々は、われわれは真の値について何らかの事前の知識を持っているはずであり、そのような知識を、あるいはほとんど何も知識をもっていないならば、その知識がないということを、何らかの形で合理的に事前の確率分布の形に表現できるならば、ベイズ流の議論がもっとも合理的であると主張している。

60年代初頭におけるベイズ観が垣間見れます。恣意的な一様分布の仮定にはかなり抵抗があるようです*3

また次回へと続きます。

*1:代表性のあるサンプルではないかもしれませんが

*2:引用注:fiducial probabilityの訳

*3:現在でもマジョリティはまあそうなのかもしれませんが