トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

逆時間集計

だんごタイプのセンサーデータ では、だんごの始まりと終わりの情報を使います。 流れタイプのセンサーデータ では、この情報がないので、同じように 3次データ を作れません。 そこで、違うアプローチをします。

このページは、原因系が1分おきなどで蓄積されているセンサーデータで、 結果系が製品ごとや、イベント発生ごとなどの時刻の情報を持っているデータを想定しています。
センサーデータ

因果の時間差

流れタイプでは、 因果の時間差 を使います。

結果系のデータがある時、それと関係のある原因系のデータがあるとすれば、その時刻は、結果系よりも前です。 切り取るデータの終わりは、この知識を使います。

流れタイプでは、切り取るデータの始まりは、簡単には決まりません。 始まりは、「流れの速さから考えると、最大でも因果の関係があるのは、このくらいの時間」、 「合計値( 積分 )が、この値になる時まで」、 「ある値が最初に見つかるまで」、といった考察をして決める必要があります。

逆時間集計の手順

実際に流れタイプのデータから、 2次データ を作る時は、一番新しい時刻から、過去に遡る形にしてデータを抽出します。 結果系のデータと同じ時刻を見つけたらフラグを立て、そこから決めた範囲を切り取る感じになります。

データを探索する時の時間の向きが、だんごタイプとは逆なので、このサイトでは、逆時間集計と呼んでいます。 データを切り取る時に使う情報源と、探索する時間の向きが違いますが、基本的な2次データ作りの手順は、だんごタイプと同じです。

逆時間集計では、結果系のデータの時刻を使って集計するので、2次データを作るのと一緒に、 3次データ も作れてしまいます。

因果の紐付けの方法として

因果の時間差 のページに、因果の分析をする時の紐付けが簡単ではない話がありますが、逆時間集計は、その対策になります。

経時解析との違い

経時解析 は、原因として起きた事の時間的な影響の変化を見ます。 原因の時刻がはっきりしています。

逆時間集計を使った分析では、結果として起きた事の、過去からの推移を見ます。 結果の時刻がはっきりしています。



再帰型ニューラルネットワーク(RNN)


順路 次は 環境と品質

Tweet データサイエンス教室