トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

主成分MT法

MT法で計算がおかしい時のようにして、多重共線性がある時に、データの意味を考える事は、とても大事です。しかし、その辺りはあまり気にしないことにして、とにかく異常の判定をできる仕組みを作りたい事もあります。

そのような場合は、データの前処理として、主成分分析を使う手があります。主成分をMT法の入力データにします。

「変数の数　＞　サンプル数」で使える理論にもなる

MT法をする場合、逆行列の計算があるため、単位空間のデータは
「変数の数　＜　サンプル数」
になっている必要があります。

ところが、この計算をする前に主成分分析をしておくと、
「変数の数　＞　サンプル数」
のデータを、
「変数の数　＜　サンプル数」
のデータに変換する事ができます。

サンプル数が少ない時は、モデルの汎用性に不安があります。しかし、そうは言っても、何も計算できないよりは、ある程度の手応えが得られた方が良い事は、多々あります。主成分MT法には、この使い道もあります。

マルチ法

マルチ法は、「変数の数　＞　サンプル数」の状況や、多重共線性でも MT法を使う方法として、作られています。

マルチ法では、まず、変数をいくつかのグループに分け、それらについてMDを計算します。次に、ひとつのサンプルについて複数できたMDを中間変数として、中間変数のMDを計算して、全体を表すMDとします。

主成分MT法では、変数のまとめ方は、主成分分析の結果として自動的に決まります。マルチ法では、変数のまとめ方は分析者が決める必要があります。この点が、主成分MT法とマルチ法の違いになっています。

主成分MT法による異常の原因分析

主成分MT法を異常の原因分析に使おうとする時の難しさですが、上の例の場合、「では、正常と異常の違いは何か」ということがわからないところになります。こういう分析に進むのでしたら、主成分MT法ではなく、普通のMT法で変数を絞り込んで、絞り込んだ変数で散布図を作った方が、その後の見通しが良いです。

MT法による異常の原因分析のページは、そのような方法の説明になっています。

ただ、主成分MT法でないとできない分析もあります。 Rによる主成分回帰分析に主成分回帰分析の場合の例がありますが、隠れ変数が原因になっている場合は、元の変数だけをいくら見ても正常と異常の違いはわからないため、主成分と変数の関係から、原因を考察する分析が必要になります。

主成分MT法の是非について

MT法でMDが計算できない事の対策として、いくつかの方法が考案されています。ただ、筆者の知る限りでは、決定版のようなものはないようです。

このページの主成分MT法は、筆者が付けた名前です。主成分回帰分析というものがありますので、それと同じように名前を付けました。

なお、主成分MT法は、 MT法の発展版という流れのため、上記の計算例では、マハラノビスの距離を使っています。

しかし、主成分同士は相関がありませんので、マハラノビスの距離を使う利点が半減しています。さらに、標準化された主成分を使う場合、マハラノビスの距離とユークリッドの距離は同じになりますので、わざわざマハラノビスの距離の計算をする必要はなくなります。

ソフト

R

RによるMT法のページで、主成分MT法もあります。

R-EDA1の場合

R-EDA1 では、主成分MT法ができるようになっています。
カーネル主成分MT法

標準化主成分得点の２乗和は、マハラノビス距離の２乗和と一致する性質も利用できるようになっています。主成分ごとに、標準化主成分得点の２乗が計算されたグラフも作られますので、どの主成分がラベルの違いに影響しているのかがわかります。

また、主成分と元の変数の相関係数もわかるようにしているので、元の変数との関係も調べられます。下図の例だと、PC5とPC6という２つの主成分が正常と異常の違いに影響していることがわかります。

さらに、この例の場合、PC5とPC6は、元のデータのどの変数とも相関が低いことがわかります。つまり、元のデータで、普段見えている増減とは異なることが、正常と異常に影響していることがわかります。
カーネル主成分MT法

ロバストな解析

中間層を使った解析

参考文献

「アンスコム的な数値例で学ぶ統計的方法23講」　廣野元久・永田靖　著日科技連　2013
統計的な方法について、一般的な解説書にはない話をしている本です。MT法もそのひとつです。
マハラノビス距離でわかった外れ値の外れの理由の解析は、変数毎ではなく、主成分分析でしています。
標準化主成分得点の２乗和は、マハラノビス距離の２乗和と一致するそうです。つまり、マハラノビス距離は、主成分で分析できます。

「品質を獲得する技術」宮川雅巳著日科技連　2000
マハラノビス距離の平方和（２乗和）は、主成分得点の２乗を固有値の逆数で重み付けされた和として、主成分分析との関係を示しています。

「よくわかるMTシステム　：品質工学によるパターン認識の新技術」　田村希志臣　著　日本規格協会　2009
「変数の数　＞　サンプル数」の時や、多重共線性がある時にMT法が使えない時の方法として、マルチMT法を紹介しています。マルチMT法がとても詳しく書かれています。

「入門 MTシステム」立林和夫著日科技連　2008
マルチ法が、少し紹介されています。

「おはなしMT（マハラノビス・タグチ）システム」　鴨下隆志・矢野耕也・高田圭・高橋和仁著日本規格協会 2004
マルチ法が、少し紹介されています。

順路次はカーネル主成分MT法