トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

多次元尺度構成法

多次元尺度構成法は、2点間の距離や結び付きの程度を表すデータ群が入力で、 それらの点の座標を出力とする方法です。 つまり、結び付きの強さの情報から、それぞれの近さを図で表現するための方法です。

例を挙げると、 東京-新潟間・東京-横浜間・東京-福島間・新潟-横浜間・新潟-福島間・横浜-福島間の距離のデータを入力すると、 それぞれの都市の座標の値が出力されます。 つまり、距離だけを見ても全体の関係はわかりませんが、地図を眺めるような感じで、全体像がわかるようになります。

なお、一口に「多次元尺度構成法」といっても、いろいろな計算方法が考案されています。 数量化W類 もそのひとつです。

多次元尺度構成法の使い方

多次元尺度構成法には、2つの使い方があります。 分析スタートに使うデータの形が違うので、使われる分野も違います。

一対評価で得たデータの分析方法として使う

上記では、地理的な距離を例にしました。 地理的な距離は、「距離」としてわかりやすいのですが、 何かと何かの近さを表すものなら、基本的に何でも使うことができます。

複数あるものの、2つずつの組み合わせについて、類似度、強さ、近さなどを 一対評価 したデータがあった時に、2つずつの組み合わせの情報から全体的な情報をあぶり出す方法として使えます。 なお、このサイトでは、多次元尺度構成法を サンプルの仲間分けの分析 に分類していますが、一般的な サンプルの仲間分けの分析 の方法は、 一対評価 のデータをスタートにできないです。 多次元尺度構成法ならではの使い方になっています。

この使い方は、 アンケート・感性評価 で得た 一対評価 のデータの分析方法として知られていますが、別の使い方もできます。 例えば、変数と変数の近さとして、決定係数がありますので、これを一対評価のデータのようにして使う方法があります。

ちなみに、「相関係数」は負の値があるので、「距離」としては使えません。 また、決定係数は大きければ、関係が強い事を意味するので、「距離」とは逆です。 逆数を使ったり、1から引いた値を使います。

多次元を2次元で見る方法として使う

この使い方は 多変量解析 のスタートのデータの形としてよく知られている、 変数を列として、サンプルを行としているデータの分析方法として使われます。 このデータから、すべてのサンプルの組み合わせについて、距離のデータを計算してから多次元尺度構成法を使います。

多次元尺度構成法では、元のデータが何次元かであるのかは関係なく、距離のデータをスタートにして、 この距離を、2次元上の距離とみなして2次元上に点を表します。

この特徴を使うと、多次元尺度構成法は、 高次元を2次元に圧縮して可視化 の方法として使うことができます。

主成分分析との使い分け

多次元を2次元で見る方法として使う時は、多次元尺度構成法と 主成分分析 の結果は似て来ます。

サンプルの仲間分けの分析をしつつ、サンプルと変数の関係も調べる分析は、 主成分分析 でないとできません。

多次元を1次元で見る方法

多次元尺度構成法を使うと、多次元を2次元で見ることができます。 この2次元の見方のポイントとして、元のデータには、値の大小に意味があっても、 この2次元データの大小には意味がありません。

ところで、多次元尺度構成法と似た方法に、 比や差による一対評価 があります。 この方法も多次元尺度構成法のcmdscaleと同じで行列の 固有値解析 をするのですが、面白いことに、固有ベクトルを1次元の座標データとして使っていくことができます。

ただし、多次元尺度構成法と違って、1次元にした時の大小関係に矛盾が起こる一対評価をすると、この方法はうまく行きません。 この方法は「一次元尺度構成法」と言えるかもしれません。

ソフト

Rによる実施例は、 Rによる多次元尺度構成法 のページにあります。

R-EDA1による実施例は、 R-EDA1によるUScitiesDとeurodistの分析 のページにあります。



順路 次は ネットワーク式の多次元尺度構成法

Tweet データサイエンス教室