トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

多次元同時付置図と3部グラフ

多対多の分析 の内、 A-A型の分析 については、分析するための数理やグラフがけっこうあります。

一方、 A-B型の分析 については、数理はあるのですが、グラフは、同時付置図や 2部グラフ しかなく、これらだけでは数理で分析したことが見切れないことがあります。 このページは、 コレスポンデンス分析 の結果をグラフにする時の解決策になります。

なお、「3部グラフ」で検索してもなかなか記事は見つかりませんが、「Tripartite graph」で検索すれば、いろいろとあります。 「多次元同時付置図」は筆者が付けた名前です。 筆者が調べた限りでは、世の中に同じ図法はないようでした。

同時付置図と多次元同時付置図の考え方

同時付置図を描く時の元データは、下の図の左側のようになっています。 数理的な方法によって、AとBをつなぐCが求まって、右側になるのですが、同時付置図(散布図)に使えるのはCの内の2つだけなので、 左から2つしか見ないことが一般的なようです。
QM

Cが3つ以上あることを知っていると分析の見落としを心配して、Cのいろいろな組み合わせを同時付置図にすることになるのですが、 グラフがたくさんできてしまうと、総合的な判断が難しくなります。

ところで、同時付置図を使った分析で見ていることは、「AとBの要素のどれが近いのか?」ということになっていて、 「Cに対してどうなのか?」ということは気にしていないことがあります。

多次元同時付置図は、「AとBの要素のどれが近いのかがわかれば良い!」ということに特化することで、 3つ以上あるCの要素を2つまで凝縮してしまう方法です。 この凝縮に 高次元を2次元に圧縮して可視化 の方法を使います。

3部グラフの考え方

2部グラフ を使うと、A-B型のデータの関係を直接的にネットワークグラフとしてみることができます。

同時付置図に使うようなデータは、Aの要素同士や、AとBの要素同士にはつながりがなく、 AとCの要素や、BとCの要素の間につながりのあるデータです。 A、B、Cのすべての要素同士の隣接行列を作ってネットワークグラフを作る方法もありますが、 データのこの性質を利用して、2部グラフにちょっと手を加える方が簡単です。

3部グラフというのは、A、B、Cの関係を見る方法です。 多次元同時付置図は、多次元になっているCを2次元に圧縮して対策しますが、 3部グラフでは、次元の数は残りますので、Cとの関係も見ることができます。
QM

ちなみに、上の3部グラフを作る時のデータを直接、2部グラフにすると、下のようになります。 これだと、「共通する要素がある」という考察がしにくいです。
QM

Rの実施例

Rの実施例は、 Rによる行と列の項目の、項目同士の類似度の分析 のページにあります。



参考文献

RPubsのページ
igprahで、3部グラフ(Tripartite graph)を描く方法が説明されています。
きれいな3部グラフができるのですが、紹介されている方法は、データの形がエッジリストになっていますし、特殊な記述方法をしています。 そのため、同時付置図用のデータを使うこのサイトの用途には合わないので、この方法は使っていません。
https://rpubs.com/barryrowlingson/tripartite




順路 次は 多対多対多の分析(A-B-C型の分析)

Tweet データサイエンス教室