トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

有向グラフになるデータの構造

矢印で結ばれたグラフは、「有向グラフ」と呼ばれます。 有向グラフは、 定性的な仮説の探索定量的な仮説の探索 の両方の使い方があります。
caucal analysis

定性的な仮説の探索 で使う時は、仮説を目で見える形に表現する形として使います。 仮説が本当なら、このグラフがそのまま因果関係を表すグラフになります。

定量的な仮説の探索 でも使うことができ、データの構造から定量的に有向グラフを作る方法があります。

データの構造から作った有向グラフを、因果関係の分析に使う時の誤用

因果関係を表す図として作る有向グラフと、データの構造から作った有向グラフは、いずれも矢印を使います。 見た目が同じになっていますし、それらしい理屈を付けることができることもあるので、 データの構造から作った有向グラフは、そのまま因果関係を表すように思えて来ます。 しかし、そんなに簡単ではないです。

わかりやすい結論で言えば、データの構造から作った有向グラフについて、本当の因果関係と比べると、 矢の始点が原因になる時だけでなく、結果になる時もあります。

データの構造から作った有向グラフは、矢印が因果の向きを表すグラフとして扱うのは誤用になります。 矢印の向きが因果の向きを表していないことを念頭に置いて、 データの非対称な構造を表すグラフとして扱い、その非対称な構造から、データの背景を考察して、因果関係の仮説を考える使い方になってきます。

実務で使う時の注意

データの構造から作った有向グラフは、どうやって作ったのかを知らない人が見ると、矢印の一般的な使い方で解釈しますので、因果関係を表す図として見られてしまいます。

そのため、会社の会議や報告書など、いろいろな人が見るところの資料に、データの構造から作った有向グラフを出すと、混乱の原因になります。 場合によっては、データ分析への不信感にもつながります。

データの非対称な構造の種類

データの非対称な構造として、ここでは3種類をまとめました。 これがすべてかどうかは、筆者にはまだわからないです。

どれも基本的には、2つや3つの変数の間で成り立つかどうかを見る使い方をします。 応用として、変数の組合せ同士の関係を見る方法としても使えます。 しかし、複雑になって来るので、対策が難しいですし、関係者に理解してもらうのが難しいので、実務の分析で使うのは難しいです。




順路 次は if-thenルールになるデータの構造

Tweet データサイエンス教室