トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

有向グラフになるデータの構造

矢印で結ばれたグラフは、「有向グラフ」と呼ばれます。 有向グラフは、 定性的な仮説の探索定量的な仮説の探索 の両方の使い方があります。
caucal analysis

定性的な仮説の探索 で使う時は、仮説を目で見える形に表現する形として使います。 仮説が本当なら、このグラフがそのまま因果関係を表すグラフになります。

定量的な仮説の探索 でも使うことができ、データの構造から定量的に有向グラフを作る方法があります。

データの構造から作った有向グラフを、因果関係の分析に使う時の誤用

因果関係を表す図として作る有向グラフと、データの構造から作った有向グラフは、いずれも矢印を使います。 見た目が同じになっていますし、それらしい理屈を付けることができることもあるので、 データの構造から作った有向グラフは、そのまま因果関係を表すように思えて来ます。

しかし、 データの構造から作った有向グラフについて、本当の因果関係と比べると、矢の始点が原因になる時だけでなく、結果になる時もあります。

データの構造から作った有向グラフは、矢印が因果の向きを表すグラフとして扱うのは誤用になります。 矢印の向きが因果の向きを表していないことを念頭に置いて、 データの非対称な構造を表すグラフとして扱い、その非対称な構造から、データの背景を考察して、因果関係の仮説を考える使い方になってきます。

実務に使う時の注意

データの構造から作った有向グラフは、どうやって作ったのかを知らない人が見ると、矢印の一般的な使い方で解釈しますので、因果関係を表す図として見られてしまいます。

そのため、会社の会議や報告書など、いろいろな人が見る資料に、データの構造から作った有向グラフを出すと、混乱の原因になります。 場合によっては、データ分析への不信感にもつながります。

データの非対称な構造の種類

データの非対称な構造として、以下の5種類をまとめました。 ただし、これがすべてかどうかは、筆者にはわからないです。

どれも基本的には、2つや3つの変数の間で成り立つかどうかを見る使い方をします。

応用として、交互作用項など、変数の組合せも見る方法としても使えますが、 分析の後の対策が複雑な話になりますし、関係者に理解してもらうのが大変なので、変数の組合せを見る方法は、実務分析では難しい使い方です。




順路 次は if-thenルールになるデータの構造

Tweet データサイエンス教室