トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

平方和分析

ANOVA
平方和分析(ANalysis Of Sum of Squares :ANOSS)というのは、名前に「平方和」とありますが、調べたいことは平方和の違いではなく、平均値の差です。 平均値の差の検定 の一種です。 分散分析 は、分散を使って平均値の差を調べていることと、似ています。

平方和分析の位置付けは、上の図になります。 21世紀の検定 という意味では、従来からある分散分析とセットで使うことを想定した方法です。

なお、「平方和分析(ANalysis Of Sum of Squares :ANOSS)」という名前は、筆者が付けました。 平方和分析は、 21世紀の検定 として、分散分析に相当するものとして、筆者が考えたものです。 世の中に、既に同じものがあれば、名前はそちらに合わせるつもりです。

平方和分析の計算

ANOVA
ANOVA
ANOVA
ANOVA
Xiは、サンプルの値、allがついているのは、全体の平均値、mがついているのは、各グループの平均値です。 分散分析では、まず、全体の平方和を、各グループの平均値からの平方和と、各グループの平均値と全体の平均値の平方和に分けます。

ANOVA
p値に相当するものは、Siの割合になります。 分散分析よりも、手順はシンプルです。

平方和分析の仕組み

Siは、それぞれのサンプルについて、自分の所属するグループの平均値からのばらつきの合計を表しています。

Smは、それぞれのグループの平均値について、全体の平均値からのばらつきの合計を表しています。

それぞれのグループが、同じ母集団からのものなら、Smはかなり小さくなります。 各グループの母集団が異なっていて、平均値が離れていると、Smの割合が大きくなります。

平方和分析の特徴

平方和の大きさは、サンプル数の影響を受けますが、p値の計算では、それらの比を計算します。

サンプル数によって、p値の精度は変わりますが、このp値には、「サンプル数が多いと小さくなりやすい」という特徴がないです。 この点が、分散分析との違いになります。

計算の例

計算の例です。ANOSSが平方和分析のp値、ANOVAが分散分析のp値です。

ANOVA  ANOVA
グループが3つで、それぞれサンプル数が3の時です。ANOSSとANOVAの違いは、それほど大きくありません。

サンプル数が100ずつなのが下記です。 ANOSSとANOVAの違いが大きく出ます。 実務では、これくらいの平均値の差は、「差はない」という結論になった方が良いのですが、そのような尺度になるのは、平方和分析の方です。
ANOVA



順路 次は 対応のある検定

Tweet データサイエンス教室