トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

ベイズ流の検定

フィッシャー流の検定と、 ネイマン・ピアソン流の検定 は、 対立仮説 の考え方が違いのポイントで、検定の問題設定の仕方の違いになっています。

このページのタイトルは、「ベイズ流の検定」にしました。 フィッシャー流とネイマン・ピアソン流は、頻度論という点で、共通です。 ベイズ流は、ベイズ統計学を基本にしていて、頻度論ではないです。 そのため、フィッシャー流、ネイマン・ピアソン流、ベイズ流は、並列に並ぶようなものではないです。

事前情報の活用

ベイズ統計学では、事前分布と事後分布を使って定式化されています。 事前分布は、前提として置いている数字や、過去の実験の数字を活用して作る分布です。

臨床試験関係では、事前情報を使って分析をしたり、実験の計画を立てられる点を、ベイズ統計学の活用として挙げています。

ベイズ流でも対策にならないこと

P値への対策として、 信頼区間 が挙げられることがあります。 これはP値の見方を広げる効果はありますが、平均値の差の検定で、できないことへの対策には、なっていないです。

ベイズ流からの対策案として、 確信区間 の活用がありますが、やはり、平均値の差の検定で、できないことへの対策には、なっていないです。

確信区間 によって改善が見込めるのは、事前情報の活用や、従来の検定では活用されていない分布(ガンマ分布や、数値計算でしか扱えない複雑な分布)の領域かもしれません。



参考文献

事前情報の活用

Guidance for the Use of Bayesian Statistics in Medical Device Clinical Trials」 FDA 2017
FDA(アメリカ食品医薬品局)によるガイダンスの原文です。
事前分布や事後分布といった基本的な説明の後に、臨床試験の計画や分析の中での、ベイズ統計学の使い方を説明しています。
https://www.fda.gov/regulatory-information/search-fda-guidance-documents/guidance-use-bayesian-statistics-medical-device-clinical-trials


なぜベイズを使わないのか!? 臨床試験デザインのために」 手良向聡 著 金芳堂 2010
第3部の約60ページを使って、FDAのガイダンスを紹介しています。
第1部と第2部は、FDAのガイダンスを読む前の前提知識になっています。


臨床試験のための アダプティブデザイン」 S.C.Chow、M.Chang 著 朝倉書店 2018
13ページを使って、ベイズ流のアプローチを紹介しています。
ベイズ更新によって、古い情報に新しい情報を重ねて行くところを利点としています。


帰無仮説と対立仮説に、事前分布と事後分布を対応させる

P値 その正しい理解と適用」 柳川堯 著 近代科学社 2018
ベイジアンの立場からはP値を批判している論文があるが、それはP値に対する誤解が原因になっている、としています。
この本では、P(H1)、P(H0)を事前確率と置いて、H1が正しい確率(H1の予測値)をベイズの定理から求める式を紹介しています。 P値は、帰無仮説H0の事後確率で、予測値は、帰無仮説H1の事後確率です。 P値が小さくなると、予測値が大きくなる性質は、この式から求まります。 そのため、ベイジアンの立場でも、P値は統計的推測のための有用なツールとしています。


確信区間を活用

瀕死の統計学を救え! 有意性検定から「仮説が正しい確率」へ」 豊田秀樹 著 朝倉書店 2020
有意性検定の問題点がいろいろ書かれていますが、p値がサンプル数で変わってしまう点については、何度も力説されています。 有意性検定にしても、その問題点の解決策として語られることの多い検出力の分析にしても、サンプル数に左右されたり、 サンプル数を最初に決めるという行為が、科学的な研究のプロセスになじまないことの説明もあります。
この本では、従来のp値に代わる指標として、研究仮説が正しい確率のphcというものが提案されています。 phcは、ベイズ統計の場合、平均値の差の検定では、平均値の差の分布が事後分布として計算されます。 その分布に対して、基準点を定めて、例えば、基準点よりも60%が上回っていれば、「60%の確率で仮説が正しい・正しくない」といった議論ができるようになります。また、基準点を段階的に変えてphcを求めることで、phc曲線を求め、これを使って考察する方法もあります。
仮説が正しい確率というのは、実務的に意味のある平均値の差かどうかをチェックするという方法のようです。 仮説が正しい確率は、p値が限りなく0になる状況と、実務的に意味のある平均値の差が必ずしも一致しないことに対して、 ベイズ統計なら平均値の分布というものが計算できることに着目して考案された方法です。


はじめての統計データ分析 ベイズ的<ポストp値時代>の統計学」 豊田秀樹 著 朝倉書店 2016
「はじめての」となっていますが、レベルが高いです。
「p値を使う検定は、不適切」という動機の元に、 ベイズ統計 の活用と、 効果量 のように、データの分布を定量化する方法を紹介しています。




順路 次は 推定

データサイエンス教室