「使い物にならないデータを見ていた!」、 「測定の再現性がすごく悪い。」、 「見たいものを、測れていなかった!」といった事は、工場のデータ分析で良くある失敗です。
統計学 や データマイニング の分野では、データが正しいことを前提にしていて、 「そもそも、そのデータは、何を、どうやって測ったものなのか?」、と言ったことには、あまり触れません。
「どこかにあるデータを使う」から、「ないデータは、自分で測って用意する」に変わると、解決できる問題が増えます。 筆者の肌感覚では、100倍から1000倍くらい増えます。
測定方法のさらに前に、そもそも「何を測るか?」は、 データサイエンス では、基本中の基本とも言えるような問題です。 ここで間違うと、測定が無意味になってしまいます。
世の中には、いろいろな尺度があります。 筆者は、物理尺度・感覚尺度・心理尺度・計算尺度の4種類に分類してみました。 これらは筆者の造語ですが、 適当な専門用語がなさそうなので、 ここでは仮にこう呼んでおきます。
ここでは、4種類に分けてありますが、 実際には、「明るさ」のように複数の種類に当てはまるものもあります。 このような場合は、その時その時で定義を把握しておかないと、誤解の原因になります。
下表には、誤差を入れてみましたが、あくまで目安です。 「個人差の問題だから、そんなに違わないだろう。」、 という理由で、感覚尺度の誤差を”中”にしました。 また、 「言葉は、人によって意味が違ったり、その言葉に対する印象が違うし、 聞かれた時のタイミングや、その人の持っている関連した情報量も違うだろう。」 という理由で、心理尺度の誤差を”大”にしました。
名前 | 測定方法 | 誤差 | 例 |
物理尺度 | 測定器(単位が明確) | 小 | m・g・pH・秒 |
感覚尺度 | 視覚・聴覚・触覚 等 | 中 | 味(辛い・甘い 等)・におい |
心理尺度 | アンケート | 大 | 怖さ・不安さ・期待度 |
計算尺度 | 各種の集計 | 中・大 | 環境影響の尺度 ・ 経済性の尺度(GDP等) ・ 経営指標 ・ KPI ・ リスク |
測定をする時には、 無意識のうちに、その人の世界観や知識が関わっています。 無意識でやっていたことを、意識的にするようになると、広くて深いデータ解析ができます。
データマネジメント では、データを管理する側面でデータの質が語られますが、以下は測定に関係した話題です。
データ分析をする時に、どのようなデータがあると望ましいのかを考えながら、測定の計画を立てた方が良いです。
例えば、温度は、温度によって物質の体積が変わる性質や、温度によって赤外線の量が変わる性質を利用します。 体積や赤外線を測ることで、温度を測ります。 これが測定の原理です。
以下は、物理的には測れないものを測る方法です。
IoTは、「Internet of Things」の略で、いろいろなモノが通信ネットワークにつながっていることを指します。
IoTから得られるものはいろいろですが、工場などでは、「見える化」が多いです。 モノの状態がグラフなどで視覚的に分かることは、それだけでも価値があります。
その外には遠隔操作があります。 この場合は、自分が遠隔操作できるということは、他人もできることになるので、セキュリティが問題視されることもあります。
IoTでは、通信の技術はもちろん重要ですが、その前に、データを取る技術も大事です。 センサーデータ が代表的です。
IoTは、 デジタルトランスフォーメーション(DX) に不可欠のツールとしても、期待されています。
「測れるもの 測れないもの」 高田誠二 著 裳華房 1998
「測る」について、歴史と著者の考察がまとまっています。
・天びんは、測り方がとてもわかりやすい。たくさんの人に見られながら測定される事で、データの正しさを確保できる。
・測れるようにしたいものは、「予兆」。ここでいう予兆とは、「バタフライ効果」のバタフライのようなもの。
空間的、時間的に細分化して測定する方法には限界がある。
それよりも、無視しがたい予兆たちを抽出して、重大な作用とのつながりを突き止めることが重要。
これをするには、細部を切り捨て、特徴的なパタンを強調するような測り方をする。
着目すべきパラメーターは、エントロピー(熱、物質、情報の)と、それらの空間的流れと、時間的変化
・測ってはいけないものは、風土、孝養、など。これらのものは、測ることよりも、これらに対しての人のあり方が大事
「<はかる>科学」 阪上孝・後藤武 編著 中央公論新社 2007
キログラムのように計測器を使う「はかる」だけでなく、意味や概念を把握することも「はかる」の一種としています。
測るものとしては、キログラム、環境、アフォーダンス、土地、穀物、国土(風水で測る)、考古学(人工衛星画像で測る)、音、美(音で測る)、罪の重さ、世界(メタファーで測る)
「心を測る」 菱谷晋介、田山忠行 編著 八千代出版 2005
「パーソナリティ」や「不安」を測る時は、下位の測定項目(因子)を作り、総合的に評価する測り方が提案されていました。
この本自体は、測り方、というよりも、
認知心理学
や
ヒューリスティクス
に関連した、心の仕組みの研究の話が多いです。
「測る技術」 黒須茂 編著 ナツメ社 2007
宇宙、微小な世界、自然、生活、人体の測り方
「なんでも測定団が行く はかれるものはなんでもはかろう」 武蔵工業大学 編 講談社 2004
人間、もの、地球、情報、環境、社会の測り方
「測れないものを測るには? 医療従事者のための評価スケール・予測モデルの考え方・活かし方」 奥田千恵子 著 金芳堂 2022
質問紙を使って、患者が感じていることを定量的に評価する方法を紹介しています。
「Statistics hacks 統計の基本と世界を測るテクニック」 Bruce Frey 著 オライリー・ジャパン 2007
正規分布を念頭において物事を理解することを、「世界を測る」と表現しています。
「空間解析入門 都市を測る・都市がわかる」 貞広幸雄・山田育穂・石井儀光 編 朝倉書店 2018
空間統計、ネットワーク分析などを使って、地理情報や建物の構造を定量化しています。
これを「都市を測る」と表現しています。
「量から質に迫る 人間の複雑な感性をいかに「計る」か」 徃住彰文 監修 新曜社 2014
テキストデータについて、意味のネットワーク構造を分析することで、感覚的なものを把握しようとしています。
「やさしい測定学 長さ、重さから粗さまで」 香住浩伸 著 科学図書出版 2002
形状の測り方を、具体的に説明。粗さや、平面度なども。
「はじめての計測工学」 南茂夫 他 著 講談社 2012
まえがきに「
企業の中では、単純で古い方法で測定している事があるが、
なぜその方法が採用されているかがわからなかったり、遅れている、と言う学生がいる。
著者は、高校の理科の教科書に、アイディアの源があると考えている。」
、という話があり、印象的でした。
この本は、さまざまな物を測る方法の原理についての解説が中心ですが、
誤差の伝播
などの考え方も解説されています。
物体を測る(距離、動き、振動、力、トルク、動力、強さ、硬さ、流速、流量)
状態量を測る(流体圧力、温度)
物質を測る(元素、気体、複雑な化合物、放射線)
「計測工学」 宮崎孔友 著 朝倉書店 1982
様々な物の計測方法の原理の他に、それを扱う電気信号の処理についても触れています。
直線変位、角変位、圧力、トルク、応力、温度、時間、角測度、流速、体積流量、質量流量、振動
「絵ときでわかる計測工学」 門田和雄 著 オーム社 2018
単位や測り方について、シンプルな説明をしています。
長さ、質量、力、圧力、時間、回転速度、温度、湿度、流体、材料強さ、形状、機械要素(ねじ・歯車)
「トコトンやさしい計量の本」 今井秀孝 監修 日刊工業新聞社 2007
製造業の中での計量の管理について、測定法や制度などの様々な話題を、読み物のようにして解説しています。
「センシングの基礎」 山崎弘郎 著 岩波書店 2005
センサーそのものの原理の話もありますが、センサーのデータがどのようなもので、どのように扱うのかの話も多いです。
人工知能
、
サンプリング
、
異常値の予測
に関連する話もありました。
「化学センサシステムとソフトコンピューティング」 大薮多可志・勝部昭明・木村春彦 著 海文堂 2001
化学センサとして、ガスセンサ、ニオイセンサ、イオンセンサ等を原理から解説しています。
エージェント
、
ファジィ理論
、
カオス
、
ニューラルネットワーク
、
遺伝的アルゴリズム
などの、
ソフトコンピューティング
と、センサーを組み合わせて、人間に近い認識のできるシステムが作れることを解説しています。
この本は、実際のシステムの事例集ではなく、そうしたシステムが作れる可能性を示す内容になっています。
「電子工作が上達するセンサーのきほん」 伊藤尚未 誠文堂新光社 2010
前半が、どのようなセンサーがあるのかの解説で、後半が、センサーを電子工作に使う方法の解説になっています。
「よくわかる最新センサーの基本と仕組み 幅広く利用されるセンサーの機能を紹介 事象検出の常識」 高橋隆雄 著 秀和システム 南茂夫
日常生活で使われている物をスタートにして、それらにどのようなセンサーが使わているのかを解説。
「センサー技術」 多田邦雄 丸善 1991
さまざまなセンサーの原理を解説。
センサーシステムとして、エアコンや自動車がどのようにセンサーを組み合わせているのかを解説。
「Pythonデータエンジニアリング入門 高速化とデバイスデータアクセスの基本と応用」 橋本洋志 他 著 オーム社 2020
センサーとパソコンなどの機器をつないで、データを収集するためにPythonでプログラムを作る時のノウハウがまとまっています。
「戦略的IoTマネジメント」 内平直志 著 ミネルヴァ書房 2019
モノビス:著者の造語で、モノとサービスの提供を一体的に進めるビジネス。
6次産業:1次、2次、3次の掛け算で「6」になっている。これらを一体的に進めること。
IoTは、モノビスや6次産業で、見える化を実現するのに必要な技術。
IoTは、手段。目的と、それを実現する筋道が大事。
データの流れなど、実現したいことを具体的に描く。
「IoTの基本・仕組み・重要事項が全部わかる教科書」 八子知礼 監修 SBクリエイティブ 2017
オムロンの「OKAO Vision(HVC-C2W)」は、顔、人体、手、顔向き、視線、目つむり、年齢、性別、表情、ペット、といった項目の認識ができるカメラセンサー。
オムロンの環境センサー(2JCIE-BL01)は、手の平サイズで、温度、湿度、照度、気圧、騒音、UV、加速度のデータが取れる。
ファナックは、ZDT(Zero Down Time)を実現するためのエッジコンピューティングのために、
Cisco Systems、Rockwell Automation、Preferred Networksと提携している。
ドイツでは、AXOOMというプラットフォームで、産業界向けのアプリ開発の環境を作っている。
プラットフォームビジネスは、APIの経由回数で課金する。
「中小企業が始める! 生産現場のIoT」 「工場管理」編集部 編 日刊工業新聞社 2018
IoTの基本的な進め方は、
「既存のデータを自動で集める仕組みを作る」、「データから意味を見つける」、「できたルールは自動化する」
「中小企業がIoTをやってみた 試行錯誤で獲得したIoTの導入ノウハウ」 岩本晃一・井上雄介 編著 日刊工業新聞社 2017
IoTでできることは見える化。この本には、生産工程の見える化の事例がある。
「 絵で見てわかるIoT/センサの仕組みと活用」 河村雅人 他 著 翔泳社 2015
センサーの技術そのものや、センサーを使ったシステムやサービスに使われる技術の話が具体的です。
6章がセンサーデータのデータ分析の話になっています。
可視化、発見、予測と分けて手順を紹介しています。
回帰分析
がセンサーのキャリブレーション(校正)に使われている話は、この本ならではです
順路
次は
データの見分け・使い分け