トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

逆時間集計

工場のセンサーデータ の内、準周期タイプのセンサーデータでは、 準周期データの分析 のようにします。周期の始まりと終わりがわかる変数を使ったり、 始まりと終わりの共通点をグラフから読み取って、そうした変数を作ってから使います。

流れタイプのセンサーデータでは、この情報がないので、同じように 3次データ を作れません。 そこで、違うアプローチをします。

このページは、原因系が1分おきなどで蓄積されているセンサーデータで、 結果系が製品ごとや、イベント発生ごとなどの時刻の情報を持っているデータを想定しています。
センサーデータ

上の図の場合は、×印のあるところが、イベントが発生したタイミングを表しています。

この例の場合は、値が大きく下がってから、上がり始めて少し経過した頃にイベントが発生していることが、グラフからわかります。 このくらいのボリュームのデータなら、このような考察で結論を出しても良いかもしれませんが、 量が多く、グラフの見た目だと、判断が難しい場合は、下記のような集計方法があります。

因果の時間差

流れタイプでは、 因果の時間差 を使います。

結果系のデータがある時、それと関係のある原因系のデータがあるとすれば、その時刻は、結果系よりも前です。 切り取るデータの終わりは、この知識を使います。

流れタイプでは、切り取るデータの始まりは、簡単には決まりません。 始まりは、「流れの速さから考えると、最大でも因果の関係があるのは、このくらいの時間」、 「合計値( 積分 )が、この値になる時まで」、 「ある値が最初に見つかるまで」、といった考察をして決める必要があります。

逆時間集計の手順

実際に流れタイプのデータから、 2次データ を作る時は、一番新しい時刻から、過去に遡る形にしてデータを抽出します。 結果系のデータと同じ時刻を見つけたらフラグを立て、そこから決めた範囲を切り取る感じになります。

下の例の場合は、イベント発生のタイミングから50個分のデータを、時間を遡って抽出しています。 このまとめ方は、準周期データの場合の1.5次データの解析に相当します。 ここまでできると、この後の手順は、 準周期データの分析と同じです。
センサーデータ

データを探索する時の時間の向きが、準周期タイプとは逆なので、このサイトでは、逆時間集計と呼んでいます。 データを切り取る時に使う情報源と、探索する時間の向きが違いますが、基本的な2次データ作りの手順は、準周期タイプと同じです。

逆時間集計では、結果系のデータの時刻を使って集計するので、2次データを作るのと一緒に、 3次データ も作れてしまいます。

因果の紐付けの方法として

因果の時間差 のページに、因果の分析をする時の紐付けが簡単ではない話がありますが、逆時間集計は、その対策になります。

経時解析との違い

経時解析 は、原因として起きた事の時間的な影響の変化を見ます。 原因の時刻がはっきりしています。

逆時間集計を使った分析では、結果として起きた事の、過去からの推移を見ます。 結果の時刻がはっきりしています。



再帰型ニューラルネットワーク(RNN)


順路 次は 自己相関分析

Tweet データサイエンス教室