フィッシャーの「統計的方法と科学的推論」が面白すぎる(その10)
今回もいわゆるフィデューシャル推測の節。
前回の続きから引用:
この推理様式の一例として、粒子を未知の頻度で互に完全に独立な時点で放射している放射能源を考えよう。あい続く二つの放射の間隔はランダムで指数分布
にしたがって分布しているだろう。ここでは単位時間あたりの平均放射数で未知数である。このような時間間隔は正確に測定可能であると考えよう。n回の測定記録からえられた間隔が
であるとしよう。これらの観測値は、
ただし
で、Xは観測された時間間隔の和、という推定量から期待される値に十分よく一致して、一般仮説が採択されると仮定する。するとの値についてデータから許される確率命題をつくることだけが問題となる。
ここは観察される値であるX(時間間隔の和)とパラメータの値であるの関係からの自然な展開として、この問題が「についての確率命題をつくる」という逆確率*1の問題に帰着できることを述べているのかな?(ちょっと意図が良く分からない)
続きの引用:
n個の時間の観測値は独立であるから、元のデータから、任意の正の値にたいする<数学的尤度>は
に比例し、これは
のとき最大となる。つまり、上で選んだ推定量Tは最尤推定量である。これはまた<十分推定量>でもある。つまり補助統計量をもたない徹底統計量*2である。なぜならば、Xの標本分布は
であるが、これから求められるの尤度関数は元のデータから得られるものと正確に同一である。Xの分布もまた、すべてのにたいして、すべての正の値の範囲で連続である。
実際、ある与えられたにたいするXの分布は、
とおくと、これが自由度2nの分布と等しくなる。この場合の分布は正確であって、頻度の不一致にたいするピアソンの尺度のように近似ではない。したがって任意の確率Pを選び、自由度2nのが頻度Pで超える値(すべてのPのたいして正確に計算できる値)を
で表すと、
という命題が、選ばれたすべてのPにたいして、頻度Pで検出される。したがって、利用可能な観測値に対応する未知パラメータの頻度分布が形式的に導かれたことになる。
「ここでパラメータの値である」を「観察された値から得られる徹底統計量T」の関数として記述することができました。フィッシャー自身の表現によると「利用可能な観測値に対応する未知パラメータの頻度分布が形式的に導かれた」ということになり、少なくとも形式的には「逆確率(分布)を求めることができた」ということになるかと思います。
この後に続くのはこの「形式的にもとめた逆確率(分布)」の「解釈」についての文章となっていきます。また次回に続きます。