トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

o値の計算方法

o値の計算方法は、大きく4つのタイプがあります。

目的に合う手法を模索して作って行く中で、10種類くらい作ってみたら、4つのタイプに分かれることに気付きました。
o-value

以下は、それぞれの検定に対して、考案したo値の計算方法の対応です。

それぞれのページでは、計算方法による違いがあります。 例えば、 平均値の差の検定のo値 には、下のグラフがあります。
test of diffence of distribution

Aタイプ : 寄与率

相関係数の2乗は、「寄与率」としての数学的な意味があります。

相関係数は、2つの連続変数の関係の指標として知られていますが、「0と1」という数字にすれば、2値変数でも使えます。これを応用します。

Bタイプ : z検定を応用

o値Bというのは、 21世紀の検定 として筆者が考案したもののうち、z検定の応用でo値を計算する方法です。

手順としては、まず、nの平方根と似た値を、z検定の検定統計量にかけます。 これによって、検定統計量の分母が、標準誤差から標準偏差に変わります。 次に、計算された確率の値を2倍します。 この手順は、p値の計算では、片側検定から両側検定への変換で使いますが、o値の計算では、0から1の範囲で変化する指標にするために2倍します。

式の違いはシンプルですが、式の意味は違います。

t値やz値といった検定統計量は、 標準化 によって作られる指標です。 分母が 標準誤差 になっています。 この検定統計量からp値が求まります。

o値は、p値の計算式の分母を、標準誤差から標準偏差に変更することで求めることができます。 この発想で求めたo値は、本サイトでは、「Aタイプ」と呼んでいます。

Aタイプは、従来から使われて来たソフトを転用できるので、導入がしやすいです。

p値の計算

z検定では、標準正規分布を仮定して、検定統計量がどの位置に来るのかを調べます。

例えば、検定統計量が「2」なら、p値は、0.025(2.5%)になります。

平均値の検定をする時は、分布は平均値の分布です。0かどうかを調べる場合(帰無仮説が、「平均値=0」の場合)は、 0を中心とした分布に対して、実際のデータから計算された平均値が、どの位置に来るのかを調べます。 平均値の分布に対して、ある平均値の現れやすさを調べます。

p値は、その位置よりも外側の面積の、全体からの割合です。

o値の計算

o値の計算では、標準誤差から標準偏差に変わったので、データの分布に対してどうなのかを調べています。

平均値は、本来なら、データの中心にあるはずですが、計算した平均値が中心からどのくらい離れているのかを調べます。 その離れ具合を、面積の割合で表現しています。

p値は、平均値の分布に対しての、ある平均値の位置から求める割合なので、「確率」としての意味を持っています。

一方、o値については、「割合」ではありますが、「確率」としての意味は持っていないです。 確率ではないのですが、確率のような感覚で使える指標として作られています。

Cタイプ : 2つの分布から計算

Cタイプは、2つのグループを比較する時に、2つのグループの分布を重ね合わせて、重なり具合の割合をo値として決めた指標です。

Dタイプ : ノンパラメトリック

Dタイプは、ノンパラメトリックな方法です。



順路 次は 21世紀の検定のサンプル数

データサイエンス教室