トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

確率と確率変数の相互変換

統計学 は、確率と確率変数の世界です。

「確率」という言葉は、一般的にも使われていますが、「確率変数」は一般的ではありません。 「確率変数」は、「変数」や 「 特徴量 」と呼ばれているもののことです。 統計学は、こうした数字は、確率的なものと考えますので、「確率変数」と呼ばれることがあります。

正規分布 の絵は有名です。 また、 データの ヒストグラム を作るとこのような絵が描けることも一般的と思います。

統計学では、ヒストグラムの横軸が確率変数になります。 確率は、ヒストグラムで描かれている図形の面積になります。 このサイトではあまり説明していませんが、 検定 を面積で説明することは、統計学でよく出て来ます。

確率データを扱いやすい形に変換

上記は、確率と確率変数の関係の、統計学的な話になります。 こういう説明にすると、「データは確率変数?」というようにも思えてしまうのですが、 「確率」の値がデータになっている場合があります。 リスク を表すデータなどです。

また、 品質学 の歩留(ぶどまり)のデータは、確率というより「比率」なのですが、 比率のデータは「確率」として扱われることがあります。

確率のデータは、そのまま使うよりも、変換した方が扱いやすくなることがあります。 こうした方法としては、 ロジット変換とプロビット変換 や、 オッズとオッズ比 があります。

確率変数から確率データへの変換

確率変数から確率データを求める有名なものは、 検定 で使われるp値です。

質的データを量的データに変換 にも、 0-1データの時系列解析 等の、確率データを求める方法があります。


順路 次は ロジット変換とプロビット変換

Tweet データサイエンス教室