トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

データサイエンス教室

測定

「使い物にならないデータを見ていた!」、 「測定の再現性がすごく悪い。」、 「見たいものを、測れていなかった!」、なんて事は、 品質学 で良くある失敗です。

統計学データマイニング の分野では、データが正しいことを前提にしていて、 「そもそも、そのデータは、どうやって手に入れたものなのか?」、と言ったことには、あまり触れません。。。

尺度の分類

測定方法のさらに前に、そもそも「何を測るか?」は、 データサイエンス では、基本中の基本とも言えるような問題です。 ここで間違うと、測定が無意味になってしまいます。

世の中には、いろいろな尺度があります。 筆者は、物理尺度・感覚尺度・心理尺度・計算尺度の4種類に分類できると思います。 これらは筆者の造語ですが、 適当な専門用語がなさそうなので、 ここでは仮にこう呼んでおきます。

ここでは、4種類に分けてありますが、 実際には、「明るさ」のように複数の種類に当てはまるものもあります。 このような場合は、その時その時で定義を把握しておかないと、誤解の原因になると思います。

下表には、誤差を入れてみましたが、あくまで目安です。 「個人差の問題だから、そんなに違わないだろう。」、 という理由で、感覚尺度の誤差を”中”にしました。 また、 「言葉は、人によって意味が違ったり、その言葉に対する印象が違うし、 聞かれた時のタイミングや、その人の持っている関連した情報量も違うだろう。」 という理由で、心理尺度の誤差を”大”にしました。

尺度の種類(その1)
名前 測定方法 誤差
物理尺度 測定器(単位が明確) m・g・pH・秒
感覚尺度 視覚・聴覚・触覚 等 味(辛い・甘い 等)・におい
心理尺度 アンケート 怖さ・不安さ・期待度
計算尺度 各種の集計 中・大 環境影響の尺度経済性の尺度(GDP等)経営指標リスク

測定の技

測定をする時には、 無意識のうちに、その人の世界観とか知識が関わっています。 無意識でやっていたことを、意識的にするようになると、広くて深いデータ解析ができるようになると思います。



尺度の独り歩き

尺度としての「お金」



参考文献

データの質

バッドデータハンドブック データにまつわる問題への19の処方箋」 Q.Ethan McCallum 著 磯蘭水 監訳 オライリー・ジャパン 2013
データのおかしさの答えがデータ自体にはなく、測定環境にもある例を、製造業の例で取り上げています。
悪いデータの話だけでなくて、このサイトの もっとデータベース にあるような話も力説していました。


情報品質 データの有効活用が企業価値を高める」 関口恭毅 著 日本規格協会 2013
情報の品質や、データの品質は、 実務でデータに向き合っている人には重要さがわかっていても、なかなか部外者には説明しにくいものです。 この本では、このテーマを正面から議論しようとしています。
情報システムやソフトを選ぶ時には、情報システム担当が想定している文脈(利用の形のイメージ)と、 実際に使う中での文脈が異なることを注意していました。
企業間でのデータのやり取りで重要になる、マスターデータの 規格 として、ISO8000シリーズがあるそうです。


「測る」への基本的な考え方

現象をさぐる データの科学」  林知己夫 著 林知己夫著作集編集委員会 編 勉誠出版 2004
現象の解明を目的とした時の統計学のあり方や、データの集め方を解説しています。


測れるもの 測れないもの」 高田誠二 著 裳華房 1998
「測る」について、歴史と著者の考察がまとまっています。
・天びんは、測り方がとてもわかりやすい。たくさんの人に見られながら測定される事で、データの正しさを確保できる。
・測れるようにしたいものは、「予兆」。ここでいう予兆とは、「バタフライ効果」のバタフライのようなもの。 空間的、時間的に細分化して測定する方法には限界がある。 それよりも、無視しがたい予兆たちを抽出して、重大な作用とのつながりを突き止めることが重要。 これをするには、細部を切り捨て、特徴的なパタンを強調するような測り方をする。 着目すべきパラメーターは、エントロピー(熱、物質、情報の)と、それらの空間的流れと、時間的変化
・測ってはいけないものは、風土、孝養、など。これらのものは、測ることよりも、これらに対しての人のあり方が大事


はじめての計測工学」 南茂夫 他 著 講談社 2012
まえがきに「 企業の中では、単純で古い方法で測定している事があるが、 なぜその方法が採用されているかがわからなかったり、遅れている、と言う学生がいる。 著者は、高校の理科の教科書に、アイディアの源があると考えている。」 、という話があり、印象的でした。
この本は、さまざまな物を測る方法の解説が中心ですが、 誤差の伝播 などの考え方も解説されています。


心を測る」 菱谷晋介、田山忠行 編著 八千代出版 2005
「パーソナリティ」や「不安」を測る時は、下位の測定項目(因子)を作り、総合的に評価する測り方が提案されていました。
この本自体は、測り方、というよりも、 認知心理学ヒューリスティクス に関連した、心の仕組みの研究の話が多いです。


センサー

センシングの基礎」 山崎弘郎 著 岩波書店 2005
センサーそのものの原理の話もありますが、センサーのデータがどのようなもので、どのように扱うのかの話も多いです。
人工知能サンプリング異常値の予測 に関連する話もありました。


化学センサシステムとソフトコンピューティング」 大薮多可志・勝部昭明・木村春彦 著 海文堂 2001
化学センサとして、ガスセンサ、ニオイセンサ、イオンセンサ等を原理から解説しています。 エージェントファジィ理論カオスニューラルネットワーク遺伝的アルゴリズム などの、 ソフトコンピューティング と、センサーを組み合わせて、人間に近い認識のできるシステムが作れることを解説しています。
この本は、実際のシステムの事例集ではなく、そうしたシステムが作れる可能性を示す内容になっています。


電子工作が上達するセンサーのきほん」 伊藤尚未 誠文堂新光社 2010
前半が、どのようなセンサーがあるのかの解説で、後半が、センサーを電子工作に使う方法の解説になっています。


よくわかる最新センサーの基本と仕組み 幅広く利用されるセンサーの機能を紹介 事象検出の常識」 高橋隆雄 著 秀和システム 南茂夫
日常生活で使われている物をスタートにして、それらにどのようなセンサーが使わているのかを解説。


センサー技術」 多田邦雄 丸善 1991
さまざまなセンサーの原理を解説。 センサーシステムとして、エアコンや自動車がどのようにセンサーを組み合わせているのかを解説。



順路 次は IoT

Tweet