成功事例からのデータの利活用 、 モデル作成からのデータの利活用 、データ探索からのデータの利活用 は、「データはある。さあ、どうする。」という状況のことが多いです。
「解決したい問題や、達成したい課題がある。さあ、どうする。」の場合は、データの利活用の進め方は変わって来ます。
問題解決と課題達成のためのデータサイエンス のページに詳しい話がありますが、 この場合は、問題解決や課題達成を進めるための手順の要所要所で、データを利活用する進め方になります。
業務を続ける限り、問題はどこかで起きます。 そのため、問題解決という仕事はなくなることはないです。
問題解決で行き詰ることはありますが、テーマがなくなることでデータ利活用ができなくなることはないです。
業務担当者にとって、問題解決は補助的な仕事なので、少しでも早く解決する必要があります。 データの利活用は、そこに貢献できます。
身近な業務の問題解決は、身近なデータの簡単な分析でも、起きていることを明らかにできることが多いです。
業務の問題解決を進めるには、「その業務ができる」というレベルでは難しいです。 その業務が、なぜ、そのようになっているのかまで知っているか、知らなかったとしても、自分で調べることができるレベルが必要です。
扱うデータは、業務の何を表しているのか、業務のどのタイミングで記録されているのか、という事を知らないと、進められないです。
例えば、自転車の故障の場合、パンク、ブレーキ摩耗、など、いろいろな種類があり、その故障の見つけ方も、修理の仕方も違います。
業務の問題解決の場合は、たくさんの関係者がいたり、見えないものを扱うこともあり、問題は複雑ですし、起きる事もいろいろです。
データサイエンスや数理最適化などには、様々な理論式があり、それらを一通り学ぶだけでも大変です。
現実の問題解決では、それでは足りないことが多いです。(現実と統計モデルとのギャップ)
問題解決の手順 で進めます。
問題解決の活動では、すでにあるデータではなく、今までに測ったことのない種類のデータが必要になることがあります。
今までに測ったことのない種類のデータといっても、必ずしも高価な投資が必要になる訳ではないです。 例えば、「家庭用の湿度計で、いろいろな天候の時の湿度を測ってみた」というだけで、テーマの成功につなげられることもあります。
「モデルが役に立つか?」の話にもつながるのですが、 「今はないけれども、必要なデータ」の案を、データの質や量も含めて、出して行きます。 「そういう作業は、 データサイエンス とは関係ないのでは?」という意見があるかもしれませんが、 データの質や量を考える時に、 統計学 や 実験計画法 の知識が役に立ちますので、 データサイエンス とは、とても関係があります。
順路 次は 日常業務からのデータの利活用