トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

分散分析のo値

平均値の差の検定のo値 は、2群についてのものです。 分散分析のo値は、2群以上の時の方法です。

分散分析のo値Bの計算

平均値の差の検定のo値B は、相関係数を使って寄与率を計算していますが、分散分析のo値は平方和から計算します。

ANOVA
ANOVA
ANOVA
ANOVA
Xiは、サンプルの値、allがついているのは、全体の平均値、mがついているのは、各グループの平均値です。 分散分析のo値では、まず、全体の平方和を、各グループの平均値からの平方和と、各グループの平均値と全体の平均値の平方和に分けます。

ANOVA
o値に相当するものは、Siの割合になります。 分散分析よりも、手順はシンプルです。

分散分析のo値の仕組み

Siは、それぞれのサンプルについて、自分の所属するグループの平均値からのばらつきの合計を表しています。

Smは、それぞれのグループの平均値について、全体の平均値からのばらつきの合計を表しています。

それぞれのグループが、同じ母集団からのものなら、Smはかなり小さくなります。 各グループの母集団が異なっていて、平均値が離れていると、Smの割合が大きくなります。

分散分析のo値の特徴

平方和の大きさは、サンプル数の影響を受けますが、o値の計算では、それらの比を計算します。

サンプル数によって、o値の精度は変わりますが、このo値には、「サンプル数が多いと小さくなりやすい」という特徴がないです。 この点が、P値との違いになります。

計算の例

計算の例です。ANOSSがo値、ANOVAがp値です。

ANOVA  ANOVA
グループが3つで、それぞれサンプル数が3の時です。ANOSSとANOVAの違いは、それほど大きくありません。

サンプル数が100ずつなのが下記です。 ANOSSとANOVAの違いが大きく出ます。 分布全体がずれているかどうかという点では、これくらいの平均値の差は、「差はない」という結論になった方が良いのですが、そのような尺度になるのは、分散分析のo値の方です。
ANOVA



順路 次は 分散の比の検定のo値

データサイエンス教室