トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

分散比の効果量の検定

分散比の効果量の検定、 ばらつきの違いの全体的な検定 の一種です。

考え方は、 平均値の差の効果量の検定 と似ています。 平均値の差の効果量の検定 は、 平均値の差の検定 の代替手段として考案していますが、 分散比の効果量の検定は、分散の比の検定の代替手段として考案しています。

分散比の効果量とは

分布のズレ方を評価する検定では、平均値の差を評価しますが、ばらつきの違いを評価する検定では、分散の比を使うのが、従来からの考え方です。 例えば、「ばらつき(分散)が5倍ある」という言い方になります。

従来は、「効果量」という呼び方はしませんが、「ばらつきの違いの効果量は何か?」と改めて考えると、分散の比が良さそうです。

分散比の効果量の検定を導く

平均値の検定、平均値の差の検定、比率の差の検定は、基本構造が同じで、
平均値の差/(標準偏差/サンプル数nの平方根)
という形をしています。 z検定 の形と同じです。

従来からあるこれらの検定について、効果量の検定では、
平均値の差/標準偏差
という形で、定式化しています。 この形にすると、効果量が評価できるようになります。

分散比の効果量の検定も、このような作り方ができると良いのですが、 分散の比の検定 は、 z検定 の形をしていません。

そこで、分散の比の検定を、 z検定 の形でやってしまう方法を考えました。 その方法については、 z検定による分散の比の検定 のページにまとめています。 そして、そこから、効果量の検定を導き出すことにしました。

平均値の検定と、その効果量の検定(シフトの効果量の検定)とのアナロジーで考えると、分散比の効果量の検定は、下表になると考えました。

評価指標の計算

分散比の効果量の検定が、上の式で定式化できるとすれば、各種の評価指標のEXCEL関数は、 比率分布の差の効果量の検定 と同様にして、以下のようにして求まるはずです。

以下のEXCELの計算式では、以下のようになっています。
s1 : 変数1の標準偏差
s2 : 変数2の標準偏差
n1 : 変数1のサンプル数
n2 : 変数2のサンプル数
ただし、s1 > s2

任意のセルに、評価指標の計算式をコピーして、S1、S2、N1、N2のセルにこれらの数字を書いておくのが、一番簡単な使い方です。

効果量の信頼区間(下側)

効果量の信頼区間です。 効果量と、標準誤差を使います。

= (s1/s2)^2 - 1.96*(SQRT( (2 * n2^2 *(n1+n2-2) ) / (n1 * (n2-2)^2 * (n2-4) ) ))

P値

NORMDIST関数の第1引数は、検定統計量です。 第2引数は、差がない事を基準にするので0です。 第3引数は、標準偏差です。

=1-NORMDIST( ( (s1/s2)^2 - n2 / (n2-2) ) / SQRT( (2 * n2^2 *(n1+n2-2) ) / ( (n2-2)^2 * (n2-4) ) ) , 0 , SQRT( (2 * n2^2 *(n1+n2-2) ) / ( (n2-2)^2 * (n2-4) ) ) ,TRUE)

P値の信頼区間(上側)

P値の信頼区間です。 P値の計算の効果量の部分を、効果量の信頼区間の下限に変更します。

=1-NORMDIST( ( (s1/s2)^2 - 1.96*(SQRT( (2 * n2^2 *(n1+n2-2) ) / (n1 * (n2-2)^2 * (n2-4) ) )) - n2 / (n2-2) ) / SQRT( (2 * n2^2 *(n1+n2-2) ) / ( (n2-2)^2 * (n2-4) ) ) , 0 , SQRT( (2 * n2^2 *(n1+n2-2) ) / ( (n2-2)^2 * (n2-4) ) ) ,TRUE)




順路 次は 分散比による重なりの検定

データサイエンス教室