トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

２次元分布のグラフと関係のグラフ

１次元散布図と２次元散布図の大きな違いは、２次元散布図は、単に分布を見るという事だけではなく、２つの次元（２つの変数）の関係を見る目的でも使われることと思います。広い意味での相関性を見るために使います。

ネットワークグラフの場合は、分布は見えませんが、たくさんの物の関係を見ることができます。

２次元分布のグラフや関係のグラフは、多変量解析、データマイニング、機械学習などを進めたい時に、頼りになるグラフです。

グラフの種類

２次元散布図　：　１対１の関係を見る。２次元の分布を見る。１対多のグラフが応用技
ネットワークグラフ　：　たくさんの物の関係を見る

２次元散布図と、ネットワークグラフの使い分け

２次元散布図やネットワークグラフは、変数の類似度の分析、カテゴリの類似度の分析、サンプルの類似度の分析の中で、分析結果を見る方法として使うことがあります。

お互いの長所と短所を考えて使い分けます。

ネットワークグラフが良い場合

ネットワークグラフは、「完全に類似・一部が類似・完全に類似しない」や「関係が強い・関係が弱い・関係がまったくない」といったことを表現できます。

例えば、下図の隣接行列のデータでネットワークグラフを作ると右図になります。
network network

隣接行列の数字がエッジ（線）の有無や、太さの違いとしてそのまま表現されています。

このデータを距離（大きい＝遠い）のデータに変換して、多次元尺度構成法を使って、散布図にすると下図になります。ネットワークグラフで、エッジが消えたような図ができます。 Dから見た時の、A、B、Cが同じようになっていて、違いが見えません。また、A、B、Cがひとつのグループに見えますが、BとCにはエッジがないことがわからなくなっています。
network

また、エッジに向きの情報を付けたい時には、散布図ではできません。

２次元散布図が良い場合

ネットワークグラフは、エッジ（線）があるので、グラフがごちゃごちゃしやすいです。また、数十個くらいの関係を表す時は良いのですが、それ以上の規模になると、コンピュータの処理が大変になりやすいです。

２次元散布図には、ネットワークグラフでは処理が厳しい時に、表現しきれていないことがあるのを承知の上で、分析する使い方があります。

分析対象によるのですが、例えば、扱っているものが「位置」だったら、AとB、AとCが近い場合、「BとCがすごく遠い」ということはあり得ません。そのため、分析対象によっては、ネットワークグラフを使うことには意味がなく、散布図の方が同じことをすっきり表現できることがあります。

順路次は２次元散布図

杉原データサイエンス事務所によるコンサルティングとセミナー