トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

データ・手法・尺度の独り歩き

データサイエンス環境学品質学経営学 の分野では、「データの独り歩き」、「手法の独り歩き」、「尺度の独り歩き」と言った事が起こりがちです。

自分自身が、データ、手法、尺度と言ったものを扱う時の注意として、「独り歩きになっていないか?」、というチェックは大事です。

この問題で一番難しいのは、社会や組織の中でこういった事が起きている場合です。 「独り歩き」と思うかどうかは、人にもよります。

データの独り歩き

「データの独り歩き」は、定量化を重視し過ぎることの弊害です。 データの信憑性のチェックをしないために起きます。

データ解析の結果が議論される時には、もとになっているデータが正しいことが前提になっていることが、よくあります。 「何を、どうやって測ったのか?」、「 測定誤差 はどのくらいあるのか?」、「外乱が含まれていたりしないのか?」等を知らないまま、データ解析をすると、 最後の結果発表の場で、足元をすくわれたりします。

バイアス(かたより)

「たくさんのデータには、真実が隠されている」、と思いたくなりますが、 ほぼ例外なく、データにはバイアスがかかっています。

日本語のデータだけを調べて、「世界の人の好みがわかった」、と思う人はいないと思いますが、 「日本人の好みがわかった」と思う事についても、「待った」がかかります。 例えば、それがインターネット上で行ったアンケートのデータなら、 「そのアンケートに答えようと思った人」、「インターネットに日常的にアクセスする人」、といった人に限定された意見になっている事に注意が必要です。

すでにあるデータを分析するところから、そのデータに関わる場合、どのように サンプリング されたデータなのかは、気にするタイミングがあまりありません。

「データから明らかになった。」と言う時には、注意が必要です。

手法の独り歩き

「手法の独り歩き」は、手法の適用範囲の拡大解釈が原因です。 ひとつの手法が、あらゆる問題解決に使えるような宣伝をされることがあります。

統計学 や、 多変量解析 の手法には、コンピュータがなかった時代に考えられたものがたくさんあります。 これらの手法は、コンピュータがなかった時代のデータに対して考えられたものです。

今は、 センサーデータ やログデータのように、最近になって発達したデータも数多くあります。 こういう新しいデータでも、古い手法は役に立つのですが、 データ解析をする時には、 データリテラシー をいろいろ使ったりして、それなりの工夫が要ります。

ある手法を使ってうまく行くのは、その手法が想定している中身のデータに、その手法を当てはめた時です。 実際のデータ解析では、手法が当てはまるようにデータを加工することもありますし、 まったく別の手法でそのデータを解析する方が良いこともあります。 要は、「万能の方法はない。」、ということですが、、、

手段の目的化

問題解決の手順 に対して、「当たり前のことを言っている」という印象を持つ人はとても多いです。 問題解決の手順では、適切な手段を選んで使って行きます。

ところが、実務の中では、「この方法を使う」、「この方法を使って成果を出す」ということが先に決まっていて、そこがスタートになることが、よくあります。 これは「手段の目的化」や、「手段が目的になる」と言われます。

「この方法」に当てはまるものとして、筆者が出会ったものとしては、 データサイエンス統計学ビッグデータスパースモデリングシミュレーション人工知能(AI)機械学習品質工学(タグチメソッド)QFD(品質機能展開)デジタルトランスフォーメーション(DX) 、等です。

新しい手段を見聞きした時に、それに興味を持って、活用しようとすることは、とても良いことです。 また、「新しいことに挑戦」ということになりますので、最初のうちは、手段を目的にするのは必ずしも悪いことではありません。

尺度の独り歩き

良い 尺度 があると、物事を的確に捉える事ができるようになります。 良い尺度を作ることは、「発明」です。

ただし、良い尺度が弊害をもたらすことがあります。 それは、「良い尺度」というステータスを与えられると、 その尺度で評価することが絶対視され、 他の評価方法を受け付けない雰囲気が生まれることです。 その尺度による評価が不適切な場合でも、 その尺度による評価が断行されたりもします。

一番の弊害は、尺度の値だけを見るようになり、 尺度の背景や、尺度を計算する時に使ったデータを見なくなることです。

品質工学のSN比環境影響の尺度経済性の尺度 の文献で、独り歩きのような解説を見かけることがあります。





尺度としての「お金」

順路 次は データサイエンスの本

Tweet データサイエンス教室