多対多の分析 の内、 A-A型の分析 については、分析するための数理やグラフがけっこうあります。
一方、 A-B型の分析 については、数理はあるのですが、グラフは、同時付置図や 2部グラフ しかなく、これらだけでは数理で分析したことが見切れないことがあります。 このページは、 コレスポンデンス分析 の結果をグラフにする時の解決策になります。
なお、「3部グラフ」で検索してもなかなか記事は見つかりませんが、「Tripartite graph」で検索すれば、いろいろとあります。 「多次元同時付置図」は筆者が付けた名前です。 筆者が調べた限りでは、世の中に同じ図法はないようでした。
同時付置図を描く時の元データは、下の図の左側のようになっています。
数理的な方法によって、AとBをつなぐCが求まって、右側になるのですが、同時付置図(散布図)に使えるのはCの内の2つだけなので、
左から2つしか見ないことが一般的なようです。
Cが3つ以上あることを知っていると分析の見落としを心配して、Cのいろいろな組み合わせを同時付置図にすることになるのですが、 グラフがたくさんできてしまうと、総合的な判断が難しくなります。
ところで、同時付置図を使った分析で見ていることは、「AとBの要素のどれが近いのか?」ということになっていて、 「Cに対してどうなのか?」ということは気にしていないことがあります。
多次元同時付置図は、「AとBの要素のどれが近いのかがわかれば良い!」ということに特化することで、
3つ以上あるCの要素を2つまで凝縮してしまう方法です。
この凝縮に
高次元を2次元に圧縮して可視化
の方法を使います。
2部グラフ を使うと、A-B型のデータの関係を直接的にネットワークグラフとしてみることができます。
同時付置図に使うようなデータは、Aの要素同士や、AとBの要素同士にはつながりがなく、 AとCの要素や、BとCの要素の間につながりのあるデータです。 A、B、Cのすべての要素同士の隣接行列を作ってネットワークグラフを作る方法もありますが、 データのこの性質を利用して、2部グラフにちょっと手を加える方が簡単です。
3部グラフというのは、A、B、Cの関係を見る方法です。
多次元同時付置図は、多次元になっているCを2次元に圧縮して対策しますが、
3部グラフでは、次元の数は残りますので、Cとの関係も見ることができます。
ちなみに、上の3部グラフを作る時のデータを直接、2部グラフにすると、下のようになります。
これだと、「共通する要素がある」という考察がしにくいです。
Rの実施例は、 Rによる行と列の項目の、項目同士の類似度の分析 のページにあります。
RPubsのページ
igprahで、3部グラフ(Tripartite graph)を描く方法が説明されています。
きれいな3部グラフができるのですが、紹介されている方法は、データの形がエッジリストになっていますし、特殊な記述方法をしています。
そのため、同時付置図用のデータを使うこのサイトの用途には合わないので、この方法は使っていません。
https://rpubs.com/barryrowlingson/tripartite
順路
次は
多対多対多の分析(A-B-C型の分析)