トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

ベイジアンネットワークによる確率計算

ベイジアンネットワーク でモデルを作っておいて、ある現象が実際に起きた時に、 他の現象の確率がどのような値になるのかを見ます。

いろいろなケースを試せますので、 シミュレーション の道具としても使えます。

解析のために準備するもの

ベイジアンネットワークの他の2つの使い方 や、一般的な 多変量解析データマイニング では、行列形式のデータを使います。 しかし、ベイジアンネットワークを使って、原因の確率を計算する時には、行列形式のデータは使いません。

その代わり、ネットワークの構造と、 それぞれの現象が起きる確率のデータが、事前の情報として必要です。

データがあいまいな時

解析の事前情報があいまいな場合は、 「この構造だったら、どうなるのだろう?」、 「この確率だったら、どうなるのだろう?」と言った感じで、 統計モデルによる仮説の探索ばらつきの作り方 の方法として使えます。

フリーソフト

Wekaがあります。

起動直後のページ → ツール → ベイズネットワークエディッター と進みます。

モデルを作って確率の値を入力する作業は、それなりに手間がかかりますが、 モデルができれば、いろいろ試せて面白いです。

解析の手順

この例では、原因の現象がAで、結果の現象がBとします。 これは、上記の2つの基本形よりもさらに単純です。 ベイジアンネットワークという感じがしないですが、実際の解析では一番基本的な部分になっています。

原因の現象Aには、「はい」と「いいえ」の2つの場合があるとします。 結果の現象Bには、「ON」と「OFF」の2つの場合があるとします。 2つの場合、というのもベイジアンネットワークでは一番簡単なものです。

エビデンス

ベイジアンネットワークの最後の手順で、「ON」と「OFF」のどちらかを入れますが、この手順は「エビデンス(証拠)を入力する」と呼ばれます。

計算では、エビデンスに当てはまるデータに1をかけ、エビデンス以外に0をかける事で事後確率を計算します。 つまり、エビデンスに当てはまらないデータは計算に使わないようにします。

エビデンスの入力は、「エビデンスに1を入れる」と言う風に呼ばれる事もあります。



参考文献

見えないものをさぐる―それがベイズ 〜ツールによる実践ベイズ統計」 藤田一弥 著 オーム社 2015
Wekaで原因の確率を推定するをやってみる方法が、詳しく説明されています。


確率論的リスク解析」 ベッドフォード T ・ クック R 著 シュプリンガー・ジャパン 2006
いろいろな観点からリスクの解析を解説しています。
ベイジアンネットワークも出て来ます。 スプリンクラー、警報器、等がネットワーク状の関係を持っている、火災の影響図の例が、具体的な確率の数字も使って紹介されています。


人工知能と知識処理」 木下哲男 著 昭晃堂 2009
人工知能 全般の本ですが、「因果ネットワーク」という名前で、ベイジアンネットワークも紹介されています。
ベイジアンネットワークでは、確率の合計は、1(100%)になっていないといけないです。 これだと、確率のわかっていない量が、1から引いた残りの確率になりますが、本当にその計算が良いのかはわからない事があります。 わかっていない事は、わかっていないまま扱う方法として、Dempster-Shafer理論が紹介されています。 


知識と推論」 新田克己 著 サイエンス社 2002
さまざまな推論法が、コンパクトかつ体系的にまとまっています。 「あいまいな知識に基づく推論」のところでベイジアンネットワークが出てきます。


知能システム工学入門」 松本啓之亮・黄瀬浩一・森直樹 共著 コロナ社 2002
確率的推論法として、ベイジアンネットワークが解説されています。



順路 次は ベイジアンネットワークによるデータの構造解析

Tweet データサイエンス教室