トップページ | 統計学の解釈学 | このサイトについて

t分布は、nとn-1の違いを考慮した理論ではない

以下は、筆者の私見です。 誤解があれば、ご教示いただけると幸いです。


「t分布は、nとn-1の違いを考慮した理論」という説明を見たことがあります。

nとn-1の違いというのは、標本分散と 不偏分散 の分母の違いのことです。
variance variance

「母分散が未知の時は、不偏分散を使う。 そうすると、n-1で割るから、標本分散よりも大きな数字になる。 それを表すのが、t分布」という理解のようですが、これは誤解です。

確認

t分布は、正規分布の標準偏差の大きさの違いだけではないことを確認してみます。
variance

上のグラフは、黒の実線が、標準正規分布です。 オレンジ色が、自由度1、つまり、n=2の時のt分布です。

黒の破線が、「もしも、n-1で割っていたら」という仮定で標準偏差を修正したものです。 1.41というのは、「2 / 1」の平方根です。

0の時が、ほぼ同じことが、まずわかります。 しかし、それ以外に違いがあります。



t分布は、サンプル数が少ない時用の理論ではない



データサイエンス教室