杉原データサイエンス事務所のロゴ トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

異常の探索(過去の異常検知)

過去のデータについて、「この時は、異常だったのではないか?」ということを調べたいことがあります。

異常の探索は、異常検知の中心的な存在です。 その中でも、中心的なのが、 外れ値検知 です。 変化点検知 は、やや専門的です。

外れ値検知

外れ値検知 は、異常を「外れ」という形で捉えます。

製品の検査データなどで使われます。

変化点検知

変化点検知 は、異常を「母数の変化」という形で捉えます。

母数の中でも、特に、平均値の変化を捉えようとすることが多いです。 「変化点」という名前ですが、明確に変化のタイミング(変化)を見つけられるとは限らないです。 また、変化点でガラッと変わる変化ではなく、連続的な変化の把握にも使える方法です。

環境の変化や、装置の変化などの把握に使われます。

外れ値検知と変化点検知の違い

変化点がある時に、外れ値があるとは限らない

外れ値は、突発的に起きるものとして、思われていることが多いです。 偶然だとすると、とても起きにくいものなので、偶然ではない理由があると考えることがあります。

もしも、外れ値が連続的に起きているとしたら、突発的ではなく、何か根本的なものが変わったと考えます。これは変化点の一種です。

一方、何か根本的なものが変わったとしても、外れ値にならないほどの変化なことがあります。 変化点があると、外れ値が連続するようなイメージになることもありますが、必ずしもそうとは限らないです。 そのため、変化点検知は、外れ値検知の応用ではなく、別のアプローチをした方が良いです。

変化点検知は、時系列データが前提

変化点検知は、時間的な変化を見るので、 時系列解析 の一種です。

外れ値検知でも、過去のデータからの変化を見て、外れを検知する場合は、時系列解析の一種です。

ただ、時系列を考慮した外れ値検知は、どちらかと言うとマイナーです。 外れ値検知として、よく見かけるのは、過去のデータの分布は時間的に普遍と仮定して、その分布に対して新しいデータが外れかどうかを判定する方法です。



順路 次は 外れ値検知


杉原データサイエンス事務所のロゴ
杉原データサイエンス事務所によるコンサルティングとセミナー