トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

オッズとオッズ比

薬の有無と、病気の有無の関係を表す2×2の 分割表 があったとします。
クロス集計

比率の集計表

リスク評価などでは、分割表のデータを使って、各カテゴリの比率(発生確率)の議論に進みます。
クロス集計 クロス集計

こうすると、「比率のpとqの違いは、どうやって評価すれば良いか?」という話ができます。

なお、pやqを使った議論の中では、サンプル数(N数)が考慮されにくいことに注意が必要です。

ちなみに、工業的な分野の リスク評価 では、 発生確率に、発生した場合の影響の大きさを値をかけ合わせた数字を「リスク」と呼ぶことが多いですが、 疫学 などの医学系の分野では、発生確率そのものを「リスク」と呼ぶことが多いです。

比率の差

pとqの差は、比率の違いの、一番シンプルな指標です。 百分率にして(100倍して)、「今回の選挙では、投票率が5ポイント上がりました」、といった感じで、ニュースなどでも使われる指標です。
クロス集計

比率の差には、 比率の差の検定 がありますので、データの数も考慮して、「差があると言えるのか?」という分析をすることができます。

リスク比

pとqの比は、リスク比や相対リスクなどと呼ばれている指標になります。
クロス集計

0から無限大までの範囲の値になります。 pとqが同じくらいの値だと、1に近くなります。

オッズ

オッズは、発生する確率と発生しない確率の比です。
クロス集計
確率は0から1までの値ですが、オッズは0から無限大の値になります。 起きにくいことは0に近く、起きやすいことは大きな値として評価する特徴があります。

不思議な計算をしますが、競馬などのように、「賭けて当たった場合に、どのくらい儲かるのか?」ということをする時には、 良い指標になるようです。

オッズの対数は、 ロジット と呼ばれていて、また別の指標として使われます。 ロジスティック回帰分析 でも使われます。

オメガ変換

品質工学 では、オッズと同じ計算式を、「オメガ変換」と呼んでいます。

品質の分野では、確率が0(0%)や1(100%)という数字が普通に存在するのですが、 0や1はオッズにすると、無限大や無限小になるので使えません。

統計学の理論では、限りなく0に近い確率や1に近い確率はあるのですが、0や1ちょうどの確率がないので、オッズで問題が起きないのかもしれませんが、 品質の分野ではオッズの使い道には工夫が必要な事があります。

オッズ比

オッズ比は、オッズとオッズの比です。
クロス集計
確率は0から1までの値ですが、オッズ比は0から無限大の値になります。 起きにくいことは0に近く、起きやすいことは大きな値として評価する特徴があります。

医学関係では、比率の差の評価は、オッズ比を使うことが慣例化しているようです。

対数オッズ比

オッズ比の対数をとると、この指標は文字通りオッズ比の対数としての意味もありますが、pとqの ロジット の差としての意味も持ちます。

対数オッズ比の使い道は、後者の意味で考えた方が広がります。

分割表からの簡単な計算

リスク比、オッズ、オッズ比は、 分割表 がなくても、何か別の方法で比率の値を手に入れれば、計算することができます。

ところで、オッズは、上記のpの計算をしなくても、
クロス集計
という計算から求めることができます。

また、オッズ比も、上記のpやqの計算をしなくても、
クロス集計
という計算から求めることができます。

何らかの形で、分割表を作ることができれば、比率の値を手に入れることが難しくても、 オッズやオッズ比は計算することができます。

各指標の比較

pとqがそれぞれ0.1から0.9までの値を0.1刻みずつ変えた場合に、 各指標の値がどのようになるのかを計算し、 ヒートマップ にしてみました。

比率の差と、対数オッズ比は、右上から左下にかけて、均等に値が増えています。 一方、リスク比やオッズ比は、右上から左下にかけて値が増えることは同じですが、 左下になるほど、急激に値が大きくなっています。 この傾向は、リスク比よりもオッズ比の方が顕著です。

クロス集計 クロス集計 クロス集計 クロス集計



参考文献

基礎統計学 栄養科学シリーズNEXT」 鈴木良雄・廣津信義 著 講談社 2012
前向き研究は、何かをしてから結果を見ていく研究方法。 非常に発生確率の低い現象は、調査期間が長く必要になるので大変になる。
後ろ向き研究は、過去に起きたことを見ていく研究方法。 過去の記録がなければできない方法。 後ろ向き研究で、全数の発生状況を調べるのが、後ろ向きコホート研究。 発生した症例をまず集め、それらの症例に背景の近い対照を2人ずつマッチさせて、仮説との関係を見るのが、症例対象研究。
前向き研究や後ろ向き研究は、時間軸の変化を見るので、縦断研究とも呼ばれる。 ある時点での違いを見るのが、横断研究。
オッズは、リスクの有無の指標として便利。 また、オッズは、a/bや、c/dで求められるので、pやqを求める必要がなく便利。
オッズ比は、(a×d) / (b×c)で求められる。 発生確率の低い現象のpやqを求めるには、たくさんの母数が必要になるので、 発生確率が低い現象では、pやqを正確に求めるための調査は不可能なことがある。 そのため、リスク比の計算ができないことがある。 オッズ比は、a、b、c、dの数字があれば求まるので、発生確率が低い現象の指標にも使える。 また、発生確率が低い現象では、オッズ比の値は、リスク比の値と近くなるため、 リスク比と同じような評価ができる。
クロス集計の解析として、比率、比率の差、リスク比、オッズ比の信頼区間や検定。


すぐわかる統計処理の選び方」 石村貞夫・石村光資郎 著 東京図書 2010
帰無仮説をオッズ比=1とするオッズ比の検定と、帰無仮説は2つの比率が同じとする 比率の差の検定 が同じ。
また、帰無仮説をオッズ比=1とするオッズ比の検定と、帰無仮説は2つの事象AとBが独立とする 独立性の検定 が同じ。


SPSSによるリスク解析のための統計処理」 石村貞夫・石村園子 著 東京図書 2004
オッズ比の計算や、比率の差の検定など。


基礎からのベイズ統計学 ハミルトニアンモンテカルロ法による実践的入門」 豊田秀樹 編著 朝倉書店 2015
オッズ比は、すべての研究デザインで使用できるが、比率の値の確認も大事。
オッズ比とリスク比の値が近いのは、比率が小さい時だけなので、いつでも同じような解釈に使えるわけではない。


独習統計学24講 すべての医療系学生・研究者に贈る 応用編」 鶴田陽和 著 朝倉書店 2016
オッズ比の話が、 ロジスティック回帰分析 につながっています。


カテゴリカルデータ解析 Rで学ぶデータサイエンス」 藤井良宜 著 共立出版 2014
指標は、ピアソンの一致性係数、クラメールのV統計量。
一般化マンテル検定、クラスカルワリス検定、マクマネー検定、オッズ比の均一性の検定など。


カテゴリカルデータ解析入門」 Alan Agresti 著 サイエンティスト社  2003
相対リスクやオッズ比による解析。 カテゴリカルデータ解析の歴史来な話もあります。


品質工学

品質工学関係では、率のデータを下の表のように集計して計算します。 リスク評価とは、qの位置が違っています。 混同行列 のページにもありますが、分野によって注目したいものが異なるのが理由のようです。
クロス集計


エネルギー比型SN比」 鶴田明三 著 日科技連 2016
2種の誤りがある場合のデジタル標準SN比は、
(1/2)*10 (log(p/1-p) +log(q/(1-q))
qの位置をリスク表と同じにすると、この計算式は対数オッズ比と同じです。


タグチメソッド入門」  田口伸 著 日本規格協会 2016
2種の誤りがある場合のSN比
10 log (pL /(1 - pL))
p0 = 1/((1 + (1/p-1))(1/q-1))^(1/2))
pL = (1 - 2*p0)^2


順路 次は 質的データを量的データに変換

Tweet データサイエンス教室