平方和分析(ANalysis Of Sum of Squares :ANOSS)というのは、名前に「平方和」とありますが、調べたいことは平方和の違いではなく、平均値の差です。
平均値の差の検定
の一種です。
分散分析
は、分散を使って平均値の差を調べていることと、似ています。
平方和分析の位置付けは、上の図になります。 21世紀の検定 という意味では、従来からある分散分析とセットで使うことを想定した方法です。
なお、「平方和分析(ANalysis Of Sum of Squares :ANOSS)」という名前は、筆者が付けました。 平方和分析は、 21世紀の検定 として、分散分析に相当するものとして、筆者が考えたものです。 世の中に、既に同じものがあれば、名前はそちらに合わせるつもりです。
Xiは、サンプルの値、allがついているのは、全体の平均値、mがついているのは、各グループの平均値です。
分散分析では、まず、全体の平方和を、各グループの平均値からの平方和と、各グループの平均値と全体の平均値の平方和に分けます。
p値に相当するものは、Siの割合になります。
分散分析よりも、手順はシンプルです。
Siは、それぞれのサンプルについて、自分の所属するグループの平均値からのばらつきの合計を表しています。
Smは、それぞれのグループの平均値について、全体の平均値からのばらつきの合計を表しています。
それぞれのグループが、同じ母集団からのものなら、Smはかなり小さくなります。 各グループの母集団が異なっていて、平均値が離れていると、Smの割合が大きくなります。
平方和の大きさは、サンプル数の影響を受けますが、p値の計算では、それらの比を計算します。
サンプル数によって、p値の精度は変わりますが、このp値には、「サンプル数が多いと小さくなりやすい」という特徴がないです。 この点が、分散分析との違いになります。
計算の例です。ANOSSが平方和分析のp値、ANOVAが分散分析のp値です。
グループが3つで、それぞれサンプル数が3の時です。ANOSSとANOVAの違いは、それほど大きくありません。
サンプル数が100ずつなのが下記です。
ANOSSとANOVAの違いが大きく出ます。
実務では、これくらいの平均値の差は、「差はない」という結論になった方が良いのですが、そのような尺度になるのは、平方和分析の方です。
順路
次は
対応のある検定