「工場のデータ」ということで、 工場のセンサーデータ の話になることは、よくあります。
ただ、その他のデータもあり、センサーデータを使うにしても、その他のデータとの 異種データの紐付け が役に立つことが多いです。 3次データ(ラベル付きデータ)の解析 は、その例です。
MESは、「製造実行システム」と呼ばれるもので、工場によっては、これを使って、「どの装置に、いつ、どのロットを投入」ということを管理しています。
品質のデータは、検査装置のアウトプットとして、MESに入っていることがあります。
品質のデータは、出荷に必要なものだけがデータベースに記録されていて、それ以外は、紙で保管されていることがあります。
工場のセンサーデータ は、データベースに入っていないことがよくあります。
データは取っているけれども、どこにも保存していない場合は、まず、保存する仕組みを作る必要があります。 データベースになくても、機械を動かすための端末には、残っていることがあります。
機械がいつ、どのように動いたのかというログデータが、役に立つこともあります。
普段見るものではないので、センサーデータ以上にデータベースには保存されにくいデータですが、機械を動かすための端末には保存されていることがあります。
このデータは貴重なデータですが、テキストデータの中に、数値が混ざっているので、テキストデータの前処理が必要です。 EXCELの機能で処理できることもあります。 ただ、機械のデータは、必ず規則があって記録されているので、その規則を読み取ってプログラミングすれば良く、自然言語処理のような難しさはないです。
主に、人が書いたもので、紙で記録されていることが多いです。 色々と便利な端末がありますが、「誰でも、簡単に、安く」といった面では、紙は今でも有効です。
紙の山があった時に、「これではどうにもならない!」、「全部、手入力か、OCRで電子化しないと、分析ができない!」という話になりがちです。 ただ、紙データのままだとしても、斜め読みしたりして、ざっくりと分類するだけで大きな成果につながることもあります。 また、電子化するにしても、ごく一部だけ、例えば、紐付けたいデータと合う部分だけ、といった風にすると、スピーディに成果につなげられることがあります。
問題解決や課題達成 に使いたいデータについては、どこにもない事がよくあります。 理由は、いくつかありますが、例えば、未解決の問題というのは、実態がよくわかっていないものなので、「データ」という形になっていないです。
こんな時は、自分でちょこっと測定したデータが、貴重なデータになることがあります。
自慢できる話ではないですが、その測定作業に不慣れな筆者が測ったことで、普段測っている熟練者のデータ(標準化された手順をしっかり守って測定したデータ)では気付けなかったことに気付けて、問題解決につながったことがあります。
専門的な知識が必要な測定については、詳しい人に協力していただくと良いですが、できるだけ自分で測るようにすると、 そのデータへの理解が深まって、問題解決の近道になることもあります。
データがそろっていれば、 因果推論 の理論を知らなかったとしても、そのデータをグラフにしただけで、問題が解決することもあります。
順路 次は 工場のセンサーデータ