トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

ベイジアンネットワークによる確率計算

ベイジアンネットワークでモデルを作っておいて、ある現象が実際に起きた時に、他の現象の確率がどのような値になるのかを見ます。

いろいろなケースを試せますので、シミュレーションの道具としても使えます。

解析のために準備するもの

ベイジアンネットワークの他の２つの使い方や、一般的な多変量解析やデータマイニングでは、行列形式のデータを使います。しかし、ベイジアンネットワークを使って、原因の確率を計算する時には、行列形式のデータは使いません。

その代わり、ネットワークの構造と、それぞれの現象が起きる確率のデータが、事前の情報として必要です。

データがあいまいな時

解析の事前情報があいまいな場合は、「この構造だったら、どうなるのだろう？」、「この確率だったら、どうなるのだろう？」と言った感じで、定量的な仮説の探索やばらつきの作り方の方法として使えます。

フリーソフト

Wekaがあります。

起動直後のページ　→　ツール　→　ベイズネットワークエディッター と進みます。

モデルを作って確率の値を入力する作業は、それなりに手間がかかりますが、モデルができれば、いろいろ試せて面白いです。

解析の手順

この例では、原因の現象がAで、結果の現象がBとします。これは、上記の２つの基本形よりもさらに単純です。ベイジアンネットワークという感じがしないですが、実際の解析では一番基本的な部分になっています。

原因の現象Aには、「はい」と「いいえ」の2つの場合があるとします。結果の現象Bには、「ON」と「OFF」の2つの場合があるとします。 2つの場合、というのもベイジアンネットワークでは一番簡単なものです。

まず、現象の関係を図にします。品質学の分野で出てくる、連関図と同じです。
原因の現象Aについて、事前に知っている情報を使って「はい」と「いいえ」の確率を入力します。「はい」と「いいえ」の確率は足して1にする必要があります。この情報としては、統計データや「たぶんこのくらいだろう」という感じの経験的な（主観的な）データが使えます。何も事前知識がないなら、「どの確率も同じ」と仮定して0.5にする方法もあります。
結果の現象Bについて、確率を入力します。「はい」の時に「ON」になる確率、「はい」の時に「OFF」になる確率、「いいえ」の時に「ON」になる確率、「いいえ」の時に「OFF」になる確率の4通りの確率を入力します。この確率に使う情報もAの時と同じです。
実際の結果が「ON」と「OFF」のどちらなのかを入力すると、原因の確率（事後確率）が計算されます。

エビデンス

ベイジアンネットワークの最後の手順で、「ON」と「OFF」のどちらかを入れますが、この手順は「エビデンス（証拠）を入力する」と呼ばれます。

計算では、エビデンスに当てはまるデータに1をかけ、エビデンス以外に0をかける事で事後確率を計算します。つまり、エビデンスに当てはまらないデータは計算に使わないようにします。

エビデンスの入力は、「エビデンスに1を入れる」と言う風に呼ばれる事もあります。

参考文献

「見えないものをさぐる―それがベイズ　～ツールによる実践ベイズ統計」　藤田一弥　著　オーム社　2015
Wekaで原因の確率を推定するをやってみる方法が、詳しく説明されています。

「確率論的リスク解析」ベッドフォード T ・クック R 著シュプリンガー・ジャパン 2006
いろいろな観点からリスクの解析を解説しています。
ベイジアンネットワークも出て来ます。スプリンクラー、警報器、等がネットワーク状の関係を持っている、火災の影響図の例が、具体的な確率の数字も使って紹介されています。

「人工知能と知識処理」　木下哲男　著　昭晃堂　2009
人工知能全般の本ですが、「因果ネットワーク」という名前で、ベイジアンネットワークも紹介されています。
ベイジアンネットワークでは、確率の合計は、１（100%）になっていないといけないです。これだと、確率のわかっていない量が、１から引いた残りの確率になりますが、本当にその計算が良いのかはわからない事があります。わかっていない事は、わかっていないまま扱う方法として、Dempster-Shafer理論が紹介されています。　

「知識と推論」　新田克己著サイエンス社 2002
さまざまな推論法が、コンパクトかつ体系的にまとまっています。「あいまいな知識に基づく推論」のところでベイジアンネットワークが出てきます。

「知能システム工学入門」　松本啓之亮・黄瀬浩一・森直樹　共著　コロナ社 2002
確率的推論法として、ベイジアンネットワークが解説されています。

順路次はベイジアンネットワークによるデータの構造解析