データ全体の差の検定 の、 平均値の差の効果量の検定 と、 差による分布の重なりの検定 は、2群についてのものです。 平方和分析は、2群以上の時の方法です。
平方和分析の位置付けは、下の図になります。
平方和分析は、
21世紀の検定
として、分散分析に相当するものとして、筆者が考えたものです。
「平方和分析(ANalysis Of Sum of Squares :ANOSS)」という名前は、筆者が付けました。世の中に、既に同じものがあれば、名前はそちらに合わせるつもりです。 名前に「平方和」とありますが、調べたいことは平方和の違いではなく、グループ間の分布全体の差です。
は、分散を使って平均値の差を調べていることと、似ています。
Xiは、サンプルの値、allがついているのは、全体の平均値、mがついているのは、各グループの平均値です。
平方和分析では、まず、全体の平方和を、各グループの平均値からの平方和と、各グループの平均値と全体の平均値の平方和に分けます。
p値に相当するものは、Siの割合になります。
分散分析よりも、手順はシンプルです。
Siは、それぞれのサンプルについて、自分の所属するグループの平均値からのばらつきの合計を表しています。
Smは、それぞれのグループの平均値について、全体の平均値からのばらつきの合計を表しています。
それぞれのグループが、同じ母集団からのものなら、Smはかなり小さくなります。 各グループの母集団が異なっていて、平均値が離れていると、Smの割合が大きくなります。
平方和の大きさは、サンプル数の影響を受けますが、p値の計算では、それらの比を計算します。
サンプル数によって、p値の精度は変わりますが、このp値には、「サンプル数が多いと小さくなりやすい」という特徴がないです。 この点が、分散分析との違いになります。
計算の例です。ANOSSが平方和分析のp値、ANOVAが分散分析のp値です。
グループが3つで、それぞれサンプル数が3の時です。ANOSSとANOVAの違いは、それほど大きくありません。
サンプル数が100ずつなのが下記です。
ANOSSとANOVAの違いが大きく出ます。
分布全体がずれているかどうかという点では、これくらいの平均値の差は、「差はない」という結論になった方が良いのですが、そのような尺度になるのは、平方和分析の方です。
順路
次は
ばらつきの違いの全体的な検定