トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

2次元分布のグラフと関係のグラフ

1次元散布図2次元散布図 の大きな違いは、2次元散布図は、単に分布を見るという事だけではなく、 2つの次元(2つの変数)の関係を見る目的でも使われることと思います。 広い意味での 相関性 を見るために使います。

ネットワークグラフ の場合は、分布は見えませんが、たくさんの物の関係を見ることができます。

2次元分布のグラフや関係のグラフは、 多変量解析データマイニング機械学習 などを進めたい時に、頼りになるグラフです。

グラフの種類

2次元散布図と、ネットワークグラフの使い分け

2次元散布図やネットワークグラフは、 変数の類似度の分析個々のカテゴリの類似度の分析サンプルの類似度の分析 の中で、分析結果を見る方法として使うことがあります。

お互いの長所と短所を考えて使い分けます。

ネットワークグラフが良い場合

ネットワークグラフは、「完全に類似・一部が類似・完全に類似しない」や「関係が強い・関係が弱い・関係がまったくない」といったことを表現できます。

例えば、下図の 隣接行列 のデータでネットワークグラフを作ると右図になります。
network network

隣接行列の数字がエッジ(線)の有無や、太さの違いとしてそのまま表現されています。

このデータを距離(大きい=遠い)のデータに変換して、 多次元尺度構成法 を使って、散布図にすると下図になります。 ネットワークグラフで、エッジが消えたような図ができます。 Dから見た時の、A、B、Cが同じようになっていて、違いが見えません。 また、A、B、Cがひとつのグループに見えますが、BとCにはエッジがないことがわからなくなっています。
network

また、エッジに向きの情報を付けたい時には、散布図ではできません。

2次元散布図が良い場合

ネットワークグラフは、エッジ(線)があるので、グラフがごちゃごちゃしやすいです。 また、数十個くらいの関係を表す時は良いのですが、それ以上の規模になると、コンピュータの処理が大変になりやすいです。

2次元散布図には、ネットワークグラフでは処理が厳しい時に、表現しきれていないことがあるのを承知の上で、 分析する使い方があります。

分析対象によるのですが、例えば、扱っているものが「位置」だったら、AとB、AとCが近い場合、「BとCがすごく遠い」ということはあり得ません。 そのため、分析対象によっては、ネットワークグラフを使うことには意味がなく、散布図の方が同じことをすっきり表現できることがあります。



順路 次は 2次元散布図

Tweet データサイエンス教室