トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

距離行列による次元圧縮

高次元を2次元に圧縮して可視化 する方法のうち、多次元尺度構成法、t-SNE、UMAPといった方法は、 距離行列 を使います。

距離行列による次元圧縮の流れ

高次元データを、まず、距離行列に変換します。 次に、距離行列から2次元データを求めます。

距離行列から高次元データを再構成するのではなく、「遠くのサンプルとの位置関係の再現は重視しない」等のアイディアで、低次元データを作ります。

多次元を1次元で見る方法

多次元尺度構成法を使うと、多次元を2次元で見ることができます。 この2次元の見方のポイントとして、元のデータには、値の大小に意味があっても、 この2次元データの大小には意味がありません。

ところで、多次元尺度構成法と似た方法に、 比や差による一対評価 があります。 この方法も多次元尺度構成法のcmdscaleと同じで行列の 固有値解析 をするのですが、面白いことに、固有ベクトルを1次元の座標データとして使っていくことができます。

ただし、多次元尺度構成法と違って、1次元にした時の大小関係に矛盾が起こる一対評価をすると、この方法はうまく行きません。 この方法は「一次元尺度構成法」と言えるかもしれません。

ソフト

Rによる実施例は、 Rによる高次元を2次元に圧縮して可視化 のページにあります。

R-EDA1による実施例は、 R-EDA1によるUScitiesDとeurodistの分析 のページにあります。



順路 次は 多次元尺度構成法

データサイエンス教室