不偏分散において「なぜnではなくn-1で割るのか」というのは色々な説明のしかたがあるかと思いますが、個人的にはタコでもわかる主成分分析さんの以下のグラフィカルな説明が一番分かりやすかったような気がします。
nで割ってしまうと、真の平均を標本平均で代替することによるバラツキの分だけ、真の分散が過小評価されてしまうのですね。
というか上記のサイトで「効果の二乗」を「情報量」と呼んでいるのですが、なぜそう呼ぶのかが一番知りたいところだったりします。
不偏分散において「なぜnではなくn-1で割るのか」というのは色々な説明のしかたがあるかと思いますが、個人的にはタコでもわかる主成分分析さんの以下のグラフィカルな説明が一番分かりやすかったような気がします。
nで割ってしまうと、真の平均を標本平均で代替することによるバラツキの分だけ、真の分散が過小評価されてしまうのですね。
というか上記のサイトで「効果の二乗」を「情報量」と呼んでいるのですが、なぜそう呼ぶのかが一番知りたいところだったりします。