トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

正規分布の差の検定

平均値の差の検定 のページにありますが、平均値の差の検定のp値は、平均値の差の有無だけを調べたい時の尺度になっています。

ところで、筆者の経験の範囲では、平均値の差の検定をする実務上の場面で、「平均値の差の有無だけを調べたい」ということは思い当たりません。 知りたいのは、「分布がずれていると言えるのか?」、「ずれは、どのくらいか?」ということなのですが、 それを知るための手段として、平均値の差の検定を使っているのが実状です。

そこで筆者が知りたいことを調べるための直接的な手段として考案したのが、このページで「正規分布の差の検定」と筆者が名付けた方法になります。 (世の中には、既に同じ方法があるかもしれないですが、筆者の知る限りではなさそうです。 もしあれば、名前はそちらに合わせるつもりです。)

2つ考えてみました。

正規分布の差の検定1(平均値の差の検定の改良)

平均値の差の検定の計算で使われている統計量は、ざっくり見ると、以下の形になっています。
平均値の差/(標準偏差/サンプル数nの平方根)

これを以下のようにします。
平均値の差/標準偏差

分母にあった標準誤差が標準偏差に変わっただけですが、これによって元のデータの範囲に対して、平均値の差がどの程度になるのかを判定できる方法になります。

こうすると、 標準化 と同じになります。 よって、例えば、上記の計算値が3の場合は、「3シグマだから、起こる確率は0.1%以下」といった、考察ができるようになります。

具体的な計算方法

EXCELの場合、例えば、差が2の場合、下の式でp値が求まります。最後の「*2」というのは、両側検定なことから来ています。
=(1 - NORM.DIST(2,0, sqrt((n1*Var1+n2*Var2)/(n1+n2)),TRUE))*2

sqrt((n1*Var1+n2*Var2)/(n1+n2))
の部分は、コーエンのdの分母と同じです。n1とn2がサンプル数、Var1とVar2が分散です。

正規分布の差の検定2(判別分析のアイディアの活用)

正規分布の差の検定2は、実際のデータに対して、統計学的な分布で近似して計算する点や、p値(確率)を計算する点は、統計学的な 検定 の方法と同じです。

また、判別の正誤の割合で判定する点は、 判別分析 のような ラベル分類 の方法と同じです。

正規分布の差の検定2は、実際のデータで正誤を判定するのではなく、分布の式で近似したデータで正誤を判定するイメージになります。

p値の考え方

test of diffence of distribution
標準偏差が0の正規分布が2つあって、平均値が2ずれている場合が上の図です。 正規分布の差の検定2では、赤くした部分の面積を、p値と考えます。

具体的な計算方法

EXCELの場合、例えば、差が2の場合、下の式でp値が求まります。
=NORM.DIST(-1,0,1,TRUE)*2

「-1,0,1」という数字ですが、 -1の「1」は、「差が2の半分」から決まっています。0は平均値が0の分布であることを表し、一番右の1は、標準偏差が1という意味です。

具体的な計算方法2(等分散ではない場合)

等分散ではない場合、つまり標準偏差が異なる場合は、 EXCELで簡単に求める式は作れないので、 数値積分をするしかないようです。 計算の仕方としては、短冊のY方向の長さは、 それぞれの位置で2つの分布の確率密度関数を計算して、 小さい方を採用することで求まります。

確率密度関数を使うメリット

正規分布の差の検定2では、実際のデータで作ったヒストグラムについて、2つの分布の重なり合っている部分を計算するのではなく、 実際のデータから作った確率密度関数で分布を近似して計算します。

こうすることで、2つの分布のサンプル数が大きく違っていても影響がないですし、データが少ない時に起きるデータの粗さの影響を小さくできます。

正規分布の差の検定の特徴

上記の2つの方法には、共通した特徴があります。

平均値の差と、p値の関係

平均値の差と、p値の関係が下の図です。いずれも標準偏差が1の正規分布で計算しているので、横軸は、コーエンのdのような効果量と、ほぼ同じ値になります。上記の2つの方法の場合が比較できるようにしてあります。 いずれも、差がなければ、1で、差が大きければ大きいほど、0に近付くので、 平均値の差の検定 のp値と似た性質を持っていることがわかります。
test of diffence of distribution

方法の2の方が、カーブが緩やかです。 方法2の場合、平均値の差が1、つまり、標準偏差とちょうど同じ時は、p値は、0.6より少し高いくらいです。 「60%くらいが共通している」ということを表しています。

サンプル数の影響

正規分布の差の検定は、分布を近似する時に、「本当にこの分布で良いのか?」という検討が必要ですが、 分布が決まった後は、サンプル数の影響を受けない方法になっています。

p値が限りなく0に近くなる、という不自然な現象が起きないです。

p値で判定できる

平均値の差の検定 では、サンプル数の影響を受けずに適切に判断する方法として、コーエンのdのような効果量があります。

この場合、「効果量がどのくらいだと、差があると言えるのか?」といった新しい尺度特有の難しさがあります。 p値には、確率や割合といった尺度で判定できる便利さと、わかりやすさがあります。

正規分布の差の検定では、p値を計算するので、検定風の分析ができるようになって、検定に慣れている人にとってはわかりやすい分析方法になっています。



参考文献

分布の差の検定」 weblio辞書
https://www.weblio.jp/content/分布の差の検定
「分布の差の検定は、 独立性の検定 と実質的に同じ」と書かれています。 つまり、ここではクロス集計表にある頻度のデータについて、「差はあるのか」と調べる方法が、「分布の差の検定」という名前になっています。
このページの名前は、「分布の差の検定」との混乱を避けるために、「正規分布の差の検定」という名前にしています。




順路 次は 真の平均値の差と、分析方法の関係

Tweet データサイエンス教室