トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

平均値の差の検定

品質管理 等の実務で、一番使われるのは、平均値の差の検定かと思います。

平均値の差の検定は、2つの母平均の差の検定が基本です。 これは、単純に2つの平均値を引き算した値についての検定です。

2つの母平均の差の検定

2つのグループがあって、平均値を比較したい場合、スチューデントのt検定と、ウェルチのt検定があります。

スチューデントのt検定には「分散が同じ」という仮定があり、ウェルチの検定にはこの仮定がありません。

これらを正確に使い分けるには、事前に 分散の比の検定 をしておく必要があります。

2つのt検定の使い分け

筆者の経験では、両者の使い分けは、問題解決の本質的な目的に対して、重要なことはありません。

ただ、どちらを選ぶのかで、 p値と有意水準の大小が逆転することがあり、この大小関係に注目されることが多いので、注意して使うことはしています。

Rによる2つの母平均の差の検定

R の使用例は下記になります。 (下記は、コピーペーストで、そのまま使えます。 この例では、Cドライブの「Rtest」というフォルダに、 「Data.csv」という名前でデータが入っている事を想定しています。 データは、2列あって、「X1」、「X2」という列名が1行目にあって、その下に数値が入っていることを想定しています。)

スチューデントのt検定

setwd("C:/Rtest") # 作業用ディレクトリを変更
Data <- read.csv("Data.csv", header=T) # データを読み込み
t.test(x=Data$X1,y=Data$X2,var.equal=T,paired=F) # スチューデントのt検定

ウェルチのt検定

setwd("C:/Rtest") # 作業用ディレクトリを変更
Data <- read.csv("Data.csv", header=T) # データを読み込み
t.test(x=Data$X1,y=Data$X2,var.equal=F,paired=F) # ウェルチのt検定

分散分析と対応のある検定

分散分析 は、集団の数が2つより多くても使えます。 対応のある平均値の差の検定 は、2つの集団同士の個々のデータに対応がある場合に使えます。

分散分析対応のある平均値の差の検定 の簡単な説明としては、上記になります。 しかし、これらには、別の使い道がそれぞれあります。



順路 次は 分散分析

Tweet データサイエンス教室