トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

工場のセンサーデータ

温度センサー、明るさセンサー、等で収集したデータを、センサーデータと言います。

特に、このページで扱う「センサーデータ」は、 定点観測にして、1秒毎や1分毎のような周期で測定を続けたデータです。 環境学 の分野では、人がなかなか入れないような場所を常時監視したり、 品質学 の分野では、工場の管理に使われています。 ビルの省エネで使われている電力モニターのデータも、センサーデータです。

センサーデータの解析は、 時系列解析 の代表的なものです。

ビッグデータ

30日は、43220分(30日×24時間×60分)なので、1分毎のデータの30日分は、43220行になります。 これくらいの量を一般的なパソコンで扱おうとすると、処理によっては「一瞬」という訳にはいかなくなって来ます。 1分毎のデータでこんな状況なので、瞬間的な変化を見るために、それよりも細かいデータを取ろうとすると、さらに厳しくなります。

また、センサーデータの解析では、たくさんのセンサーの関連性に注目したい時があるので、 上記の行数のデータがセンサーの数の分だけ増えていきます。

「ビッグデータ」が世の中で脚光を浴びていますが、 センサーデータもビッグなデータです。

生産方式と、データのタイプの関係

工場のセンサーデータは、生産方式によって見た目がかなり違い、アプローチの仕方も違います。

バッチ式は、準周期タイプ

準周期タイプは、パン作りでいえば、オーブンからパンを出し入れして焼く場合の、オーブンの温度のデータです。 工場では、バッチ式と言われる生産方法です。 工場に限らず、イベントが繰り返している現象のデータが当てはまります。

パンを焼く時間にばらつきがあったり、パンの出し入れの時間にばらつきがあるので、準周期タイプになります。

振動のデータや、電気信号のような正確な周期はないので、 正確な周期を分析する時の スペクトル解析 は使えません。 準周期データの分析 で、正確な周期ではない部分のばらつきを定量化していくことが、分析のポイントになります。
センサーデータ

連続式は、流れタイプ

流れタイプは、トンネル式のオーブンで、オーブンを通過しながら焼く場合のオーブンの温度です。 工場では、連続式と言われる生産方法です。 パンは固体ですが、化学工場など、製品が気体や液体で、それらを流しながら変化させて製品を作る方法でよく使われます。プロセス系とも呼ばれます。
センサーデータ

気象データとイベントの関係を分析するような場合も、流れタイプになります。

流れタイプを 状態解析 でアプローチしたり、それに 因果の時間差 を考慮することがありますが、なかなか難しいです。 準周期データの分析 と似たアプローチには、 逆時間集計 があります。

ディスクリート式は、ある期間について周期タイプ

ディスクリート式は、バッチ式と連続式の間のような生産方式です。 例えば、機械的に規則正しく回転している1回転毎で、1つ製品ができるような方式です。
センサーデータ

基本的には、機械的に規則正しく動いているので、その間は、かなり精確に周期的です。 準周期タイプのような、時間のばらつきは、時々起きるようなデータになります。

そのため、ディスクリート式では、周期的な時だけを選んで、その範囲について、周期的なデータの分析方法が使える点が、バッチ式との違いになります。 時期による周期的な特徴の違いを調べられます。 ただし、ディスクリート式だとしても、 準周期データの分析 で知りたいことがわかることが、よくあります。




順路 次は TQC

Tweet データサイエンス教室