温度センサー、明るさセンサー、等で収集したデータを、センサーデータと言います。
特に、このページで扱う「センサーデータ」は、 定点観測にして、1秒毎や1分毎のような周期で測定を続けたデータです。 環境学 の分野では、人がなかなか入れないような場所を常時監視したり、 品質学 の分野では、工場の管理に使われています。 ビルの省エネで使われている電力モニターのデータも、センサーデータです。
センサーデータの解析は、 時系列解析 の代表的なものです。
30日は、43220分(30日×24時間×60分)なので、1分毎のデータの30日分は、43220行になります。 これくらいの量を一般的なパソコンで扱おうとすると、処理によっては「一瞬」という訳にはいかなくなって来ます。 1分毎のデータでこんな状況なので、瞬間的な変化を見るために、それよりも細かいデータを取ろうとすると、さらに厳しくなります。
また、センサーデータの解析では、たくさんのセンサーの関連性に注目したい時があるので、 上記の行数のデータがセンサーの数の分だけ増えていきます。
「ビッグデータ」が世の中で脚光を浴びていますが、 センサーデータもビッグなデータです。
工場のセンサーデータは、生産方式によって見た目がかなり違い、アプローチの仕方も違います。
準周期タイプは、パン作りでいえば、オーブンからパンを出し入れして焼く場合の、オーブンの温度のデータです。 工場では、バッチ式と言われる生産方法です。 工場に限らず、イベントが繰り返している現象のデータが当てはまります。
パンを焼く時間にばらつきがあったり、パンの出し入れの時間にばらつきがあるので、準周期タイプになります。
振動のデータや、電気信号のような正確な周期はないので、
正確な周期を分析する時の
スペクトル解析
は使えません。
準周期データの分析
で、正確な周期ではない部分のばらつきを定量化していくことが、分析のポイントになります。
流れタイプは、トンネル式のオーブンで、オーブンを通過しながら焼く場合のオーブンの温度です。
工場では、連続式と言われる生産方法です。
パンは固体ですが、化学工場など、製品が気体や液体で、それらを流しながら変化させて製品を作る方法でよく使われます。プロセス系とも呼ばれます。
気象データとイベントの関係を分析するような場合も、流れタイプになります。
流れタイプを 状態解析 でアプローチしたり、それに 因果の時間差 を考慮することがありますが、なかなか難しいです。 準周期データの分析 と似たアプローチには、 逆時間集計 があります。
ディスクリート式は、バッチ式と連続式の間のような生産方式です。
例えば、機械的に規則正しく回転している1回転毎で、1つ製品ができるような方式です。
基本的には、機械的に規則正しく動いているので、その間は、かなり精確に周期的です。 準周期タイプのような、時間のばらつきは、時々起きるようなデータになります。
そのため、ディスクリート式では、周期的な時だけを選んで、その範囲について、周期的なデータの分析方法が使える点が、バッチ式との違いになります。 時期による周期的な特徴の違いを調べられます。 ただし、ディスクリート式だとしても、 準周期データの分析 で知りたいことがわかることが、よくあります。
順路 次は TQC