トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

平方和分析

データ全体の差の検定 の、 平均値の差の効果量の検定 と、 差による分布の重なりの検定 は、2群についてのものです。 平方和分析は、2群以上の時の方法です。

平方和分析の位置付けは、下の図になります。

平方和分析は、 21世紀の検定 として、分散分析に相当するものとして、筆者が考えたものです。
ANOVA

名前について

「平方和分析(ANalysis Of Sum of Squares :ANOSS)」という名前は、筆者が付けました。世の中に、既に同じものがあれば、名前はそちらに合わせるつもりです。 名前に「平方和」とありますが、調べたいことは平方和の違いではなく、グループ間の分布全体の差です。

は、分散を使って平均値の差を調べていることと、似ています。

平方和分析の計算

ANOVA
ANOVA
ANOVA
ANOVA
Xiは、サンプルの値、allがついているのは、全体の平均値、mがついているのは、各グループの平均値です。 平方和分析では、まず、全体の平方和を、各グループの平均値からの平方和と、各グループの平均値と全体の平均値の平方和に分けます。

ANOVA
p値に相当するものは、Siの割合になります。 分散分析よりも、手順はシンプルです。

平方和分析の仕組み

Siは、それぞれのサンプルについて、自分の所属するグループの平均値からのばらつきの合計を表しています。

Smは、それぞれのグループの平均値について、全体の平均値からのばらつきの合計を表しています。

それぞれのグループが、同じ母集団からのものなら、Smはかなり小さくなります。 各グループの母集団が異なっていて、平均値が離れていると、Smの割合が大きくなります。

平方和分析の特徴

平方和の大きさは、サンプル数の影響を受けますが、p値の計算では、それらの比を計算します。

サンプル数によって、p値の精度は変わりますが、このp値には、「サンプル数が多いと小さくなりやすい」という特徴がないです。 この点が、分散分析との違いになります。

計算の例

計算の例です。ANOSSが平方和分析のp値、ANOVAが分散分析のp値です。

ANOVA  ANOVA
グループが3つで、それぞれサンプル数が3の時です。ANOSSとANOVAの違いは、それほど大きくありません。

サンプル数が100ずつなのが下記です。 ANOSSとANOVAの違いが大きく出ます。 分布全体がずれているかどうかという点では、これくらいの平均値の差は、「差はない」という結論になった方が良いのですが、そのような尺度になるのは、平方和分析の方です。
ANOVA



順路 次は ばらつきの違いの全体的な検定

データサイエンス教室