「データ分析」と言っても、人によってイメージしていることが違い、話が合わないことがあります。 ここでは「会社のためのデータ分析」の話に絞りますが、それでも話が合わないことがあります。
会社のためのデータ分析の目的には種類があることと、それらと手法の関係がわかりにくいのが一因のようです。 また、「モデルを作る」ということが目的になっている方が多いのも、一因のようです。
なお、 データサイエンスの仕事 や データサイエンスの数理 のページにも、このページと似た話が入っています。
データ分析の目的は、会社の実務の目的になります。 データ分析が必要とされる実務は、問題解決や課題達成です。
日常用語としては、「問題」と「課題」を同じように使うことがありますが、区別するのが最初のポイントです。
会社の実務の中で、データ分析をする目的は、問題解決と課題達成の2つに大きく分けると、考えやすいです。
問題解決の「問題」というのは、学校の試験で出て来るような問題ではなく、ここでは、あるべき姿とのギャップです。 例えば、「機械が異常な状態」、「不良品の発生」、「作業ミス」などが当てはまります。
課題達成の「課題」というのは、学校で出される課題と同じ意味で考えても良いですが、 「問題」のような書き方をするのなら、ありたい姿とのギャップです。 例えば、「人の作業を、無人でできるようにする」、「新規ビジネスと、その仕組みを作る」などが当てはまります。
問題解決と課題達成は、完全に2種類に分かれるのではなく、問題解決の方法のひとつが課題達成になることもあります。 また、課題達成と思っていても、もともとは問題解決が動機になっていることもあり、根本的な解決をしたいのなら、問題解決として考えた方が良いこともあります。
「問題解決のためのデータ分析」や「課題達成のためのデータ分析」と考えると範囲が広いので、 問題解決や課題達成の中身を少し掘り下げて考えるのが次のポイントになります。
QCストーリー では、もっと内容がありますが、データ分析が特に関係するところとして以下の3つに絞りました。
「現状の把握」、「方法の立案」、「効果の確認」という3つの段階は、データ分析をまったくせずに、できてしまうこともあります。 しかし、これらの段階の要所要所で、適切なデータ分析を使うと、 効率的に進められたり、効果的な方法を考えたり、確信を得たり、といったことができるようになります。
データ分析が得意な人の視点だと、データ分析の流れに乗ることに話が限定されがちですが、「問題解決や課題達成の流れを中心にして、 必要に応じて適切なデータ分析を使う」という考え方をするのが、一番確実と思います。
データ分析としては、「BI」と呼ばれるソフトが得意な領域です。 BIソフトと似たようなことができる、 Excelのピボットテーブル も役に立ちます。
現状の把握のひとつとして、因果関係を調べたいことがあります。そのような時は 因果推論 を進めます。 シミュレーション でいろいろなパターンを作ってみて、現象の特徴の理解を進めることも因果推論の役に立ちます。
データ分析としては、ソフトや手法を使いながら、とにかくデータをよく見ることや、データの背景や、 データになっていないことにも思いを巡らせて、何が起きているのかを理解することが中心になります。 現状を把握することが目的なので、数理モデルの精度にこだわる必要はありません。
現状の把握の中で、問題解決や課題達成の方法が明確になったり、データどうこうの話ではないことがわかったりすることもあります。 場合によっては、現状の把握をしてすぐに問題解決や課題達成ができます。
なお、問題や課題を持っている会社としては、これはこれで成果になりますが、この後に「開発」につなげることが成果になる立場の人にとっては、 困ったことになります。
現状の把握だけでは、問題解決や課題達成の方法が見えない場合は、方法の検討に入ります。
ここでも シミュレーション が役に立つことがあります。 実際に物を使って実験をするのなら、 実験計画法 も役立ちます。
機械学習 の数理モデルで判定したり、適正値を計算する仕組みがあると良さそうなら、モデル作りをします。
手法としては、 検定 が役に立ちます。
「データ分析とは、機械学習や数理のモデルを作ること」という理解をされている方が、とても多いです。
しかし、問題解決や課題達成という目的のデータ分析では、そうしたモデルが出てくる場面は、一部分ですし、 テーマによっては出てこないこともあります。 問題解決や課題達成の方法が、モデルになるのかどうかはケースバイケースです。 選択肢のひとつにはなったとしても、 例えば、「業務の順番を入れ替える」など、モデルとはまったく違うアプローチをすると、もっと早く、安く、効果的な方法になる可能性があります。
ちゃんとしたデータを知っている訳ではないのですが、「AI導入プロジェクト」、「機械学習プロジェクト」、「データ分析プロジェクト」といったものが、 なかなか前に進まなかったり、成果につながりにくい場合の理由として、 「機械学習などの数理的なモデルを使えば、問題解決や課題達成ができるはず」という考え方をしてしまっていることが、とても多いのではないかと思います。
特に、問題解決の方法としてモデルが重要な役割を担うことは、課題達成に比べると、とても少ないのではないかと思います。
「テーマになるような、お困りごとを教えてください」という聞き方をすると、
聞かれた方は「問題」を挙げやすくなり、それをテーマとしたために、苦難の道になることも多いようです。
課題の種類によっては、
「ニーズ(要求仕様)の把握 → 設計 → 試作 → ・・・」
という、システム開発や商品開発のプロセスがぴったり当てはまるものがあります。
また、
「商品紹介 → 試用 → ・・・」
という商品紹介から販売までのプロセスに、うまく乗るものもあります。
これらの場合は、モデル作りを念頭において進めても、無理なく進められることがあります。
世の中の「AI導入プロジェクト」、「機械学習プロジェクト」、「データ分析プロジェクト」の成功例は、 このプロセスに当てはまった課題の場合が多いように思っています。
会社にとって有意義なのは、左側の@〜Eの案を出して順位付けをしていくことを、効率的・効果的にできることと思います。
昨今のデータサイエンティストに求められているスキルは、プログラミングや数理、あるいは画像解析などの経験が中心ですので、 @〜Cの案をデータサイエンティストが出すのは至難の技かもしれません。 しかし、データサイエンティストであるのならば、 「データ」を根拠として、こうした案も出せるようになっていくのが、理想と思います。
順路
次は
データサイエンスの仕事