フィッシャーの「統計的方法と科学的推論」の訳者解説が素晴らしすぎる（その６）

前回から続きます（強調は引用者）：

もう一つの、そうして最もやかましい議論を生じた問題は、区間推定に関してである。

いま上にあげたのと同じ問題について考えると、
$Pr\{|\bar{X}-\mu|\geq 1.96/\sqrt{n}\}=0.95$
となるから、これを変形して
$Pr\{\bar{X}-1.96/\sqrt{n}\leq \mu \leq \bar{X}+1.96/\sqrt{n}\}=0.95$
と表される。したがって $\bar{X}-1.96/\sqrt{n}$ と $\bar{X}+1.96/\sqrt{n}$ で限られた区間に母数 $\mu$ が含まれる確率は95%であるということになる。ところでネイマンはいう。このことは、決して $\bar{X}$ の特定の実現値が観測されたとき、たとえば5個の値を観測して $\bar{X}$ =75.5という数字を得たとき、
$75.5-1.96/\sqrt{5}\leq \mu \leq 75.5+1.96/\sqrt{5}$
となる確率が95%であるとうことを意味するわけではない。 $\mu$ は確率変数ではなく一定の値だから、 $\mu$ は上記の区間に含まれるか含まれないかのどちらかである。したがって確率は0か1かであってその中間ではない。
$Pr\{\bar{X}-1.96/\sqrt{n}\leq \mu \leq \bar{X}+1.96/\sqrt{n}\}=0.95$
という式は同じ母集団に、標本から同じ形式で区間を構成することを繰返し行ったときにその区間が真の値を含む場合が全体の95%になることを意味するにすぎない。95%という数字は個々の区間について確率を表さないから区別して信頼係数と呼ぶ。

これはネイマン=ピアソンの（というか現在の頻度主義統計学における標準的な）信頼区間の解釈ですね。この解釈を統計学ビギナーに説明するのはいつも大変ですが、この部分を理解しているかどうかで、「その人がどのていど仮説検定という営為について深く理解しているか」が判ってしまうという踏み絵的問題かもしれません*1。

続き：

これに対してフィッシャーは次のように考える。
$Pr\{\bar{X}-1.96/\sqrt{n}\leq \mu \leq \bar{X}+1.96/\sqrt{n}\}=0.95$
という式がすべての $\mu$ について成立つ以上、この $\bar{X}$ に特定の値を入れたxについてもその確率が95%であると考えてもよいではないか。それはこのような特定の値を入れたときの命題の信頼性を表す合理的な尺度である。なるほど、もとの確率についての命題は $\bar{X}$ を中心として右左に動く範囲が真の値を含む頻度が95%ということであった。しかしこのような区間の集まりの中で、いま得られた特定の観測値に対応する区間を特に区別する理由が存在しないのだから、この特定の区間が真の値を含む確率が95%とのべることは全く合理的である。このような考え方から導かれるのが推測確率である。

これがフィッシャーの推測確率（フィデューシャル確率）的な信頼区間の解釈ですね。分かりやすい説明。

続き：

推測確率の考え方は非常に多くの議論をまき起こした。その批判は二つあり、一つは確率概念をこのような形で用いることに対する批判、第2はこのように定義される推測確率から矛盾が生ずるということであった。第1の点については、確率を命題の信頼性という意味で考えることにあるのであれば、このような確率を直ちに否定することはできない。第2の点についてはなお二つの問題がある。そのうち一つは推測確率の定義のしかたが唯一通りには定まらないということであり、第2はそれを確率として普通の確率について行われるような演算を適用すると矛盾が生ずるということであった。第1の点については一般に
$Pr\{\bar{X}-1.96/\sqrt{n}\leq \mu \leq \bar{X}+1.96/\sqrt{n}\}=0.95$
というような形の式からいつでも推測確率が定義されるとすると、矛盾が生ずる例がいくつか示されている。しかし推測確率が成立するために重要なことは上の式が成立するだけでなく、その上さらに $\bar{X} \pm 1.96/\sqrt{n}$ という形で与えられる区間が”区別されない”ということが大切である。矛盾を生ずる例においてはこの点の条件が欠けているように思われる。最近D. A. S. フレイザーは標本空間と母数空間の変換群に対する”不変性”の概念を導入してこの点を明確にさせた（Fraser 1961）。第2の点についてはリンドレーがいくつかの条件について吟味し、推測確率の議論が成り立つのは、問題が第6章8節でのべられているような位置と尺度の母数に関するものに帰着できる場合に限られることを示した（Lindley 1958）。

推測確率に関する数学的位置づけの話ですね。後半についてはちょっと私には理解が追いつきませんが、なんとなく雰囲気は伝わる気がします。

続き：

推測確率の概念についての批判は、いずれもまだ決定的なものがあるとは思われない。と同時にフィッシャー自身の定義は甚だあいまいであり、その定義づけ、定義法がもっと明確にされなければ、それを正しいと認めることもできないように思われる。問題は未解決な点が残っている。

これに対してネイマンの信頼区間の考え方は明快であるが、しかし信頼係数は確率とは違うといわれただけでは実際問題としては、必ずしも満足ができないであろう。できればそれを少なくとも”確率と同じように”扱うことができることが望ましい。これについては次のようなことが示された。信頼係数を確率のように扱うことができるということは、それが95%であれば、その命題が正しい場合と正しくない場合に対する賭けの比率が1:19でなければならない。このような賭けを考えた場合、信頼係数を確率と考えることが合理的であるためには、その賭けがまったく公平である、すなわちどのように賭けても全く利益の期待値が等しくならなければならない。しかしこのことは任意の信頼区間については必ずしも成立しない（Wallace 1959; Buehler 1959）。

推測確率はやはり数学的定義がはっきりしない概念のようです。そうなるとコルモゴロフの公理以降の数理統計学の発展の中で顧みられなくなっていくのは必然なのかもしれません。また、やはりベイズの枠組みが広く受け入れられたことにより問題設定------事前分布を用いずに逆確率を定義することの切迫性------自体が実感として消失してしまったのも大きいでしょう。因みに上記引用後半の”賭け”の話は信頼区間をベイズ的な主観確率の枠組みに持ち込む試みの話かと思われます。

また次回に続きます。

*1:なんか偉そうですね。お前だって半可通のくせに＞自分

Take a Risk：林岳彦の研究メモ

自らの研究に関連するエトセトラについてのメモ的ブログです。主にリスク学と統計学を扱っています。

フィッシャーの「統計的方法と科学的推論」の訳者解説が素晴らしすぎる（その６）