トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

平均値の検定のo値

平均値の検定 用の o値 を説明します。

distribution gap
以下の例では、上のような10個のデータがあり、「平均値は、0よりも大きいと言えるか?」を調べたかったとします。 このデータの平均値は0.45、標準偏差は0.42です。

平均値の検定のo値A(パラメトリック)

効果量

平均値の検定のo値Aでは、
(平均値 ― 基準値) / 標準偏差
を効果量と考えます。

平均値と基準値の差が、標準偏差の何倍かを見ています。 これは、 標準化 と同じ作業をしています。 標準化をすると、標準正規分布でよく知られている確率の考え方が使えます。

上の例だと、平均値は0.45、基準値は0、標準偏差は0.42なので、「(平均値 ― 基準値) / 標準偏差」は、約1です。 o値として見るのは、上の図の赤い部分になります。 この場合は、約16%(0.16)です。

平均値の信頼区間

平均値の検定では、平均値の信頼区間が下記の式になっています。 95% t値というのは、サンプル数で変わりますが、約2です。

効果量の信頼区間

平均値の信頼区間から、効果量の信頼区間は、下記とします。

o値

正規分布を仮定して、基準値の位置から決まる赤い色の範囲をo値と考えます。
distribution gap

z検定を使うと、下の式でo値が求まります。
=NORM.DIST(0,0.45,0.42,TRUE)

0、0.45、0.42の位置が異なっていますが、下の式でも、同じo値が求まります。 これは、検定統計量にあらかじめ標準化をするかどうかが、違いになっています。
=1 - NORM.DIST((0.45 - 0)/0.42,0,1,TRUE)

o値の信頼区間

o値の信頼区間は、 p値の信頼区間 と同様に、効果量の信頼区間の上側と下側の値を、o値の計算式に入れて計算します。

下記は、信頼区間の上側の求め方ですが、下側でも同様です。

EXCELの場合、例えば、下の式でo値の信頼区間(上側)が求まります。nは、サンプル数です。
=(1 - NORM.DIST((0.45 - 0)/0.42 - 1.96/sqrt(n),0,1,TRUE))*2

平均値の検定のo値B(ノンパラメトリック)

平均値の検定のo値Bは、簡単です。 0以下のデータの割合を調べます。 この例では、10個中1個なので、
o値 = 0.1 (= 1 / 10)
です。

平均値の検定のo値Aは、分布を仮定して計算する必要がありますが、平均値の検定のo値Bは、何でも使えます。ノンパラメトリック検定の一種とも言えます。




順路 次は 対応のある平均値の差の検定のo値

データサイエンス教室