データサイエンスの独り歩き に限ったことではなく、健康法などでもありますが、 ひとつの方法が、あらゆる問題解決に使えるような宣伝をされることがあります。
統計学 や、 多変量解析 の方法には、コンピュータがなかった時代に考えられたものがたくさんあります。 これらの方法は、コンピュータがなかった時代のデータに対して考えられたものです。
今は、 センサーデータ やログデータのように、最近になって発達したデータも数多くあります。 こういう新しいデータでも、古い手法は役に立つのですが、 データ解析をする時には、 データリテラシー をいろいろ使ったりして、工夫が要ります。
ある方法を使ってうまく行くのは、その方法が想定している中身のデータに、その手法を当てはめた時です。 実際のデータ解析では、方法が当てはまるようにデータを加工することもありますし、 まったく別の方法でそのデータを解析する方が良いこともあります。 要は、「万能の方法はない。」、ということですが、、、
会社の活動では、「この方法を使う」、「この方法を使って成果を出す」ということが先に決まっていて、そこがスタートになることが、よくあります。 これは「手段の目的化」や、「手段が目的になる」と言われます。
「この方法」に当てはまるものとして、筆者が出会ったものとしては、 データサイエンス 、 統計学 、 ビッグデータ 、 スパースモデリング 、 シミュレーション 、 人工知能(AI) 、 機械学習 、 品質工学(タグチメソッド) 、 QFD(品質機能展開) 、 デジタルトランスフォーメーション(DX) 、等です。
新しい手段を見たり聞たりした時に、それを活用しようとすることは、「新しいことに挑戦」ということになり、とても良いことです。
この場合は、手段が目的になるところからスタートしますが、悪いことではないです。
手段を目的にすることが悪いことになるのは、いつまでも手段が目的のままになっている場合です。
「どこかで、使い方は見直しましょう」と言うのは簡単ですが、導入したい人の都合やこだわりがあるので、見直しは、難しいことが多いです。
良い 尺度 があると、物事を的確に捉える事ができるようになります。 良い尺度を作ることは、「発明」です。
ただし、良い尺度が弊害をもたらすことがあります。 それは、「良い尺度」というステータスを与えられると、 その尺度で評価することが絶対視され、 他の評価方法を受け付けない雰囲気が生まれることです。 その尺度による評価が不適切な場合でも、 その尺度による評価が断行されたりもします。
一番の弊害は、尺度の値だけを見るようになり、 尺度の背景や、尺度を計算する時に使ったデータを見なくなることです。
品質工学のSN比 、 環境影響の尺度 、 経済性の尺度 の文献で、独り歩きのような解説を見かけることがあります。
このページの話は、統計学が、今も抱える大問題です。
ひとつは、「P値は0.05以下にすれば良い」という尺度の独り歩きが進んでしまったことです。
もうひとつは、従来の検定は、統計量の確からしさの評価手法として作られているのに、「2群に違いがあるといえるか?」といった評価に使われることが慣習になってしまったことです。(統計的な検定と、統計教育の歴史)
順路 次は データサイエンスの不可能性