杉原データサイエンス事務所のロゴ トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

距離の関係を保って2次元に圧縮する方法

高次元を2次元に圧縮して可視化 では、距離を使う方法がメジャーです。

距離による次元圧縮の流れ

自己組織化マップ (SOM)以外は、考え方が似ています。

多次元尺度構成法 (MDS)、tSNE、UMAPでは、多次元の距離を、2次元の距離と考えて、その距離が計算されるような2次元座標を求めます。

データが数個のグループに分かれている場合は、多次元を2次元に再配置しても、大きな矛盾は発生しないです。

ところで、高次元を2次元に圧縮する方法では、近いサンプルがどのくらい近いのかが重要で、遠いサンプルがどのくらい遠いのかは気にしないことがあります。 この特徴を利用して、tSNE、UMAPでは、近さの精度が上がるように、配置されます。

多次元を1次元で見る方法

多次元尺度構成法を使うと、多次元を2次元で見ることができます。 ここで作られる2次元データは、数字の大きさに意味がありません。

ちなみに、多次元尺度構成法と似た方法に、 比や差による一対評価 があります。 この方法も多次元尺度構成法のcmdscaleと同じで、行列の 固有値解析 をするのですが、面白いことに、得られた数字(固有ベクトル)の大きさには意味があります。 この性質が AHP で使われます。

ソフト

Rによる実施例は、 Rによる高次元を2次元に圧縮して可視化 のページにあります。

R-EDA1による実施例は、 R-EDA1によるUScitiesDとeurodistの分析 のページにあります。



順路 次は 多次元尺度構成法


杉原データサイエンス事務所のロゴ
杉原データサイエンス事務所によるコンサルティングとセミナー