トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

MT法で計算がおかしい時

MT法の手順 を単純に実施しようとすると、途中で計算不能になることがあります。 よくある原因は、 「単位空間のデータで、標準偏差が0になる項目がある。」と、 「単位空間のデータの項目間に多重共線性がある。」の2つです。

結論を先に書きますが、これらの問題が起きるのは、 MT法 が想定していないデータを扱ったためです。 MT法は忘れて、MT法以外の視点でデータを見直さないと、解決しません。

下記は、異常検知のモデルを作る時ではなく、 因果推論MT法 を使う時に大事な考え方です。

標準偏差が0の項目

標準偏差が0になるのは、2つのケースがありますが、 いずれの場合だったとしても、 この項目はMT法で評価すべき項目とは言えません。 この項目は別扱いで検討することとし、 これ以外の項目だけでMT法を実施します。

単位空間と信号空間のデータの両方の標準偏差が0の場合

この項目は現象に対して何の影響もしていないと言えます。 つまり、この項目は調査対象から外すべきものです。

単位空間の標準偏差が0で、信号空間の標準偏差が0ではない場

MT法で、この項目の重要さを評価することはできません。

しかし、MT法を使わなくても、この項目は重要項目であると言えます。 この項目に変動が起きている時と、異常の発生している時が同期していると言えるためです。

多重共線性の取り扱い

多重共線性 が問題になるのは、2つのケースがあります。

単位空間と信号空間のデータの両方で多重共線性がある場合

多重共線性の関係にある項目のどれかを使わないことにし、 多重共線性が発生しないようにします。

「小手先の対応ではないか?」という疑問が起きるかもしれませんが、 多重共線性があるということは、データとして区別できないということなので、 これ以上進む方法がありませんし、これで十分です。 考えるべきは、「なぜ、多重共線性になるのか?」という、 サンプリング の方であって、MT法の対応策ではありません。

信号空間のデータでは多重共線性がない場合

この場合は、少々、厄介です。 まず、多重共線性の関係のある項目をなくして、 MT法を試します。

もしも、多重共線性がある項目が異常の原因であるのなら、 「信号空間のデータでは多重共線性がない。」という事実が、 原因究明の突破口になる可能性があります。 「なぜ、信号空間のデータでは多重共線性がないのか?」を検討することも大事です。




順路 次は 主成分MT法

Tweet データサイエンス教室