トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

ばらつきの違いの検定

平均値の差の検定 がありますが、このページのタイトルは、「ばらつき違いの検定」としていて、「標準偏差の差の検定」にはしていません。

この理由は、まず 誤差の伝播 のページにもありますが、標準偏差同士は、足したり、引いたりできない性質があるので、数学的な意味での「差」という言葉が当てはまりません。 また、ばらつきの違いを見るのに、数学的な差ではなく、「比」を使います。

さらに、標準偏差は平均値と単位が同じになるので、ばらつきの尺度として理解しやすいのですが、 ばらつきを扱う検定では、検定の対象が分散になります。

2つの母分散の比の検定

2つのグループがあって、標準偏差の違いの有無を調べたい場合は、F検定があります。

平均値の差の検定 では、「2つのグループの分散が同じ(等分散)」という仮定のあるものがあります。 そのため、ばらつきの違いの検定は、「等分散性の検定」として、平均値の差の検定の前に使われることがあります。

Rによる2つの母分散の比の検定

R の使用例は下記になります。 (下記は、コピーペーストで、そのまま使えます。 この例では、Cドライブの「Rtest」というフォルダに、 「Data.csv」という名前でデータが入っている事を想定しています。 データは、2列あって、「X1」、「X2」という列名が1行目にあって、その下に数値が入っていることを想定しています。)

setwd("C:/Rtest") # 作業用ディレクトリを変更
Data <- read.csv("Data.csv", header=T) # データを読み込み
var.test(x=Data$X1,y=Data$X2) # 2つの母分散の比の検定

3つ以上の場合の検定

複数のカテゴリについて、分散(ばらつき)が同じかどうかを調べるための検定のひとつが、バートレット検定です。

分散分析 には等分散の仮定がありますので、その検定に使われることがあります。

ちなみに、バートレット検定は、一元配置分散分析の等分散性の検定に相当するのですが、 多元配置分散分析(二元以上のもの)に対して、ばらつきの違いの検定はないようです。

実験データの解析 で、多元のものに対して、ばらつきの違いを分析する方法としては、 二段階設計 として 品質工学 が使っているものがあります。 ただし、検定ではありません。

Rによるバートレット検定

R の使用例は下記になります。 (下記は、コピーペーストで、そのまま使えます。 この例では、Cドライブの「Rtest」というフォルダに、 「Data.csv」という名前でデータが入っている事を想定しています。

データは、1列目は「X」という列名でカテゴリ、2列目は「Y」という列名で数値が入っていることを想定しています。

setwd("C:/Rtest") # 作業用ディレクトリを変更
Data <- read.csv("Data.csv", header=T) # データを読み込み
bartlett.test(formula=Data$Y~Data$X) # バートレット検定




順路 次は 比率の差の検定

Tweet データサイエンス教室