トップページ | Q&Aの一覧 | このサイトについて | ENGLISH

Q&A

Q(ご質問)

高次元(多変量)のモデルを作ることはありますか?

A(ご回答)

あります。

補足

筆者の実務経験として、 「画像データを扱うテーマを実務でやったことがない」、 「工場のセンサーのデータを扱うテーマの経験がある」というお話をさせていただいた時に、よくいただくご質問です。

この話になる時のおまけとして、質問をいただいた方に、「センサーのデータは、1次元データだから、この人は1次元データの分析を、よくやっている。 高次元を扱う経験があると言っても、センサーが複数になって、数次元に増えるだけなので、画像データに比べれば、ぜんぜん大したことがない。 この人は、簡単なデータ分析しかやったことがない。」と思われてしまうことがあります。

最終的に「簡単」と思うかどうかは人それぞれですが、そう判断する前に、質問をいただいた方に、知っておいていただきたいことがあります。 ご理解いただけたことはないのですが、下記のようなことになります。

「1個のセンサーデータ = 1次元のデータ」ではない

工場のセンサーデータを扱う時は、主要なデータは、1個の温度計のデータだけのこともあります。 このデータに対して、1次元のデータとして分析をすることはもちろんあるのですが、それでは済まないことがあります。 そもそも、1次元データとしてわかるようなことは、工場で普段からそのデータに関わる仕事をしている方は、わかっています。 筆者がご相談をいただくのは、「1次元データの分析では、問題が解決しないから」、ということが経緯としてあります。

詳しいことは、 センサーデータの解析 にありますが、もともとのセンサーデータは、このサイトでいうところの、「1次データ」です。「2次データ」に変換する必要があります。 この変換では、工場のバッチ生産方式や、ディスクリート生産方式の知識を使います。

2次データでは、2次元以上になるのが普通です。 そのため、1個の温度計のデータであっても、高次元のデータとして扱うことになるのですが、 この変換の必要性を理解するには、生産方式の話もからんで来るので、 なかなかご理解いただけないです。

「2次データ(特徴量)を作るのは簡単ではない」

2次データを作る話になると、ディープラーニングを知っている方は「そんな作業は、ディープラーニングを使えば自動化できる」 、という解釈をされることが多いです。

工場のデータ分析は、ものづくりの原理原則で説明できるものでないと、データ分析をした後が進みません。 工場の方々に共感していただけないですし、運用方法も決められません。

そこまで考えて、2次データを作るのは、少なくとも筆者にとっては簡単ではないです。

ディープラーニングの分野には説明性を求める話があり、研究も進んでいますが、 ものづくりの原理原則の領域にまで踏み込んで、 今、現場で起きていることを何とかする技術として使えるのは、まだだいぶ先のようです。

「工場のデータ分析では、モデル作りが重要ではないことが多い」

詳しくは データの利活用の進め方データサイエンスの仕事データ分析の仕事 のページにありますが、工場のデータ分析では、モデルを作ることが重要ではないことが多いです。

一方で、質問をいただく方は、モデルを作って工場のシステムに組み込むことを、データ分析の後の作業としてイメージしていることが多いです。 しかも、ディープラーニングなどの複雑な数理モデルが必要と思われていることが多いです。

モデル作りが重要ではないことが多いのに、モデル作りの話が中心になって、その結果として、 「この人は、簡単なデータ分析しかやったことがない。」という結論をいただくことが、とても多いです。。。



Tweet データサイエンス教室