フィッシャーの「統計的方法と科学的推論」の訳者解説が素晴らしすぎる（その５）

前回からの続きです：

改めてフィッシャー対ネイマンの論争にもどって、具体的に争点となった問題を説明しよう。

最初に問題となったのは仮説検定論である。フィッシャーは、カール・ピアソンと同じく、仮説検定の問題を、得られた標本が仮定された分布をもつ母集団から得られたものであるかどうかを判定することとして考えた。簡単な例として、 $X_1,X_2,......,X_n$ が互いに独立に正規分布N([ $\mu$ ,1)に従うことがわかっているとき、 $\mu=0$ という仮説を検討するのに、たとえば $|\bar{X}|\>1.96/\sqrt{n$ }]ならば、このようなことが起るのは、仮説が正しいときには100回に5回しかないから、仮説は正しくないように思われるというのである。したがって問題は適当な統計量（ここでは $\bar{X}$ ）の分布を求めて、それがある限界を越す確率が小さいかどうかを判定する基準を与えることである。ところでもし仮に $|\bar{X}|$ がさらに2.58/ $sqrt{n}$ よりも大きいというのであれば、そのことが仮説のもとで起るのは100回に1回だから、仮説はより一層正しくないように思われることになる。このような仮説の正しくないであろうと考えられる程度の強さ有意水準という言葉で表される。前の場合は有意水準5%、後の場合は有意水準1%で有意と呼ばれる。

これがフィッシャーの仮説検定に対するスタンスですね。ネイマン=ピアソンの場合はどうなのでしょうか。

続き：

ところでネイマン＝ピアソンの仮説検定論の考え方はこれと異なっている。たとえばn=25とするとき、仮りに $|\bar{X}|$ の実現値が $1.96/\sqrt{n}=0.39$ より大きいから5%で有意、 $2.58/\sqrt{n}=0.52$ より大きかったら1%で有意というように、個々の実現値をもとにして議論をすることは客観的に根拠を持たないというのがネイマンの考え方である。仮説検定の方式は標本に通用すべき”ルール”を与えるのでなければならない、すなわちあらかじめ定数cを決めておいて $|\bar{X}|>c$ ならば仮説は正しくないと判定する（棄却する）。[tex:|\bar{X}|

1.　仮説が正しいときに、誤って仮説が棄てられる確率を一定の小さい値（5%あるいは1%）以下になるようにする。

2.　1の条件の下で、仮説が正しくないときには、仮説が棄てられる確率（検出力）をなるべく大きくする。

そうしてここでいう確率という意味はもちろんこのような一定の検出方式を繰り返し適用した場合の棄却の頻度を意味している。

これがネイマン=ピアソンの立場ですね。

続き：

これに対してフィッシャーのこのような同じ検定方式の繰り返しという形で確率を考慮することはまったく無意味であると主張して、上記の二つの条件を拒否している。

実際的な問題として考えた場合、相異は次のような点に現れる。

1.フィッシャーの有意水準は、標本から得られた値によって決まる。すなわち5%になったり、1%になったり、あるいはもっとこまかく計算して2.25%といったりすることがありうる。これに対してネイマンの考え方では有意水準は標本を見る前にあらかじめ5%なら5%と決めておかねばならない。 $|\bar{X}|$ が $1.96/\sqrt{n}$ にほとんど同じであっても、 $|\bar{X}|$ が $5/\sqrt{n}$ というようなときでも、5%の棄却という判定は同じであってそれを区別することは認められない。

2.有意水準の意味付けを離れてもフィッシャーとネイマンの立場の相違から、同じ問題について異る答が出される場合がある。それはネイマンの確率計算は標本のあらゆる実現値についての平均についてであるのに対して、フィッシャーの議論は標本の個々の実現値の個々の場合について考えるからである。ネイマンの場合では棄却域の中に仮説が正しいことがはっきりわかるような点が含まれることもあり得る。そういう点が含まれても全体として誤りの確率が小さければかまわないことになる。フィッシャーの場合にはそのようなことはない。2×2表に関する議論もこの点に関係している（第4章4節）。