トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

データマネジメント

データマネジメントは、組織的なデータの管理のことです。

クオリティマネジメントとの類似点

製造業では、1980年代頃から、クオリティマネジメント(品質管理・QM)が提唱され、 TQM が盛んに進められました。 必要な内容を網羅的に並べて、組織全体で行動していく点が、データマネジメントとクオリティマネジメントは似ています。

TQMでは、組織が顧客に提供するものの品質について、様々な観点から、安定させたり、向上させようとします。 品質保証をするための観点もあります。

データマネジメントでは、組織の中のデータを、一元的にシステムで管理しようとします。

クオリティマネジメントでは、紙ベースの管理が煩雑になったり、文書化の手間が問題になり、一部ではシステム化も進んでいます。 クオリティマネジメントとデータマネジメントは一体になって構築し、運用するのが理想的と筆者は考えています。

データ品質

クオリティマネジメントとデータマネジメントの接点にあるキーワードが、「データ品質」です。

クオリティマネジメントの観点では、製品の品質を顧客に品質保証するために、まず、製品の状態を表すデータの品質が重要になります。 長さが重要な製品なら、長さのデータになりますし、外観が重要なら、「キズなし」といった外観のデータです。

また、「製品が定められた手順で作られたので大丈夫」ということを示せるようにするには、製造履歴のデータが重要になります。

データ品質の一般的な評価軸として、DMBOKでは、正確性、完全性、一貫性、整合性、妥当性、適時性、一意性、有効性が紹介されていますが、 こうしたデータ品質の観点は、製品の品質のクオリティマネジメントには、あればあるほど良いものです。

クオリティマネジメントのためのデータ分析

製品に品質問題が起きて、原因を調べて行くと、データ品質の確保の仕方に原因があることがあります。 データ品質の評価軸を、 特性要因図 の要因と考えて行くと、因果関係の仮説を立てる時の参考になります。

データ品質の評価軸のそれぞれについて、事例を挙げてみると、下記のようになります。

データマネジメントで扱うデータの範囲

データマネジメントでは、会社がビジネスをするために必要なデータについて、すべてを把握できる状態にしようとします。

物を作って、売っている会社だと、作るために必要なデータや、売る物のデータがデータマネジメントの対象になります。

データマネジメントの外

ところで、「会社で起きている問題を解決するために必要なデータ」、というものもあります。 そういったデータは、その問題が解決すれば、その後は必要がなくなることもあり、ビジネスに直接関係しないこともあります。 少なくとも2022年現在のデータマネジメントでは、そういったデータは対象外になっています。

データマネジメントの範囲で扱っているデータだけを使ってできる事(わかる事)と、範囲外のデータも加えてできる事は違います。 データマネジメントをしっかりやっていれば、やっている程、データマネジメントの範囲の中のデータだけを見れば良いような気持ちになりやすいようなのですが、 それで良いかどうかは、扱っている内容次第です。

データマネジメントの中だけのデータを使う場合と、外のデータも使う場合の違い

例えば、「SQLを使って集められるデータ」というのは、データマネジメントがよくできている会社で、データマネジメントの範囲の中のデータを指していることが多いです。 ビジネスの状態の分析は、このデータを使う分析になって来ます。 SQLでデータベースから必要なデータを集めて、計算したり、グラフにしたりします。

問題解決をしたい時は、例えば、「今日から1週間、この作業の時間を記録してみよう」、「装置の内部コンピュータのログと関連付けてみよう」、という感じで、 SQLで集められないデータを集めてみて、ビジネスの状態の理由を調べます。
DM



参考文献

データマネジメント

データマネジメント知識体系ガイド 第二版」 DAMA International 著 日経BP社 2018
DMBOKの第二版です。
第1章 データマネジメント : データとは何か、から始まって、組織の中でデータを扱っていくのに必要なポイントや、戦略の立て方
第2章 データ取扱倫理 : データを扱う上で、個人の権利を無視したり、公平性が失われないようにする。この状態を確立するにはリスク管理。
第3章 データガバナンス : データを資産として管理できる組織を作る。
第4章 データアーキテクチャ : データを扱うシステムの要素や、それらのつながり方の設計
第5章 データモデリングとデザイン : リレーショナル、ディメンジョナル、オブジェクト指向、ファクトベース、タイムベース、NoSQLの6つのスキームの比較
第6章 データストレージとオペレーション : データベースの種類と管理
第7章 データセキュリティ : 脅威の種類と、対策の種類
第8章 データ統合と相互運用性 : データの共有や連携の仕組み
第9章 ドキュメントとコンテンツ管理 : リレーショナルデータベースに保存されていないデータの管理。語彙の管理も。訴訟の対応でも重要
第10章 参照データとマスターデータ : 参照データ、マスターデータの種類と管理
第11章 データウェアハウジングとビジネスインテリジェンス : データウェアハウスを構築して、BIで分析
第12章 メタデータ管理 : メタデータの種類と、管理の種類
第13章 データ品質 : データの品質管理は、製品の品質管理と類似。SPC(統計的工程管理)も使う。データ品質には、正確性などの12の評価軸がある。国際規格がISO8000。
第14章 ビッグデータとデータサイエンス : データのモデルを作って活用していく時の知識。分散処理の話が多め。具体的なツールはRのみ。
第15章 データマネジメント成熟度アセスメント : レベル1から5までを評価して、組織の成熟度を改善する
第16章 データマネジメント組織と役割期待 : 組織のタイプと、成功のための要素
第17章 データマネジメントと組織の変革 : データマネジメントがうまくいかない要因を紹介。対策は、危機意識を高めて組織を変える、等。


データマネジメント知識体系ガイド 第一版」 DAMA International 著 日経BP社 2011
DMBOKの第一版です。 データマネジメントをする中で出て来る用語の定義、データマネジメントを分業するためのいろいろな役職の役割、 データマネジメントに必要な観点などを体系的にまとめています。


DXを成功に導くデータマネジメント データ資産価値向上と問題解決のための実務プロセス75」 小川康二・伊藤洋一 著 翔泳社 2021
「モノのビジネスからコトのビジネスに変わる時に必要なのが、DX。 これに必要なのが、顧客の状態や考えがわかるデータ。 このデータに応じて組織が動くのが、データ駆動型経営。」という考え方の元に、それを実現する基盤としてデータマネジメントを解説しています。 ただし、DXの話は冒頭の方だけで、この本の主な内容は、モノのビジネスでも当てはまるものでした。
ダークデータは、使い道がないのに捨てられていないデータ。(測定のページあるダークデータとは、意味がまったく異なる)
この本では、データ分析は将来の予見を得るためのものになっている。 現状把握や、因果分析は想定していないようです。
データマネジメントでは、顧客につながるまでのすべての業務フローを設計し、その中でやりとりされるデータを明らかにして、 一元的に管理しようとします。 フローが決まると、分散したシステムが相互に依存することで、スパゲティのようになってしまう問題にも対策できます。


データマネジメント業務改善の正攻法 戦略から実践」 データ総研 編著 日経BP社 2015
データマネジメントの考え方を元にした、システム設計について説明


戦略的データマネジメント 企業利益は真のデータ価値にあり」 トーマス・C.レドマン 著 翔泳社 2010
 データ品質の重要さの後に、その管理の話が続きます。


経営のためのデータマネジメント入門」 喜田昌樹 編著 中央経済社 2018
経営のためにデータを活用する方法を調べた結果を、まとめたような内容になっています。
データマネジメントよりも、データサイエンスの話が多めです。


保全データマネジメントの考え方報告書 MOSMS保全技術プログラム」 日本プラントメンテナンス協会 編著 日本プラントメンテナンス協会 2020
MQ(Maintenance Quality)、EQ(Engineering Quality)、OQ(Maintenance Quality)の3つのデータをうまく組み褪せて、想定外の事故の防止に使うための考え方があります。


データ基盤

実践的データ基盤への処方箋」 ゆずたそ・渡部徹太郎・伊藤徹郎 著 技術評論社 2021
ECサイトのビジネスを例にして、データ基盤の作り方を解説しています。 データの形や、システムの構成だけでなく、データ基盤を支える組織の作り方も含まれています。
データ基盤は、データレイク、データウェアハウス、データマートの3つで作る。 データレイクは、多様なデータをそのまま集めるところ。一か所にすることに意味がある。 データウェアハウスは、加工・結合したデータを置く場所。 データマートは、特定用途向けのデータを作っておく場所。
この本で主に解説されるのは、継続的な活用ができるデータ基盤の作り方です。 「はじめに」のところに、データ基盤に関係した話として、データ基盤が作られても継続的に活用されない問題が紹介されていて、 データ基盤側に原因がある場合は、この本の内容が対策になっています。 データ基盤の利用者側の原因については、特に書かれていませんでした。
ECサイトでは、「商品」と「人」を中心にしたデータ分析が重要なので、この本のようなデータ基盤が重要になって来るのは理解しました。 ただ、ビジネスのフローに入っていない要素や、「商品」や「人」のようなキーでまとめられないビジネスの場合は、 この本のようなデータ基盤には入ってこない(入れられない)ので、それはそれで考える必要があることも、改めてわかりました。


データ分析基盤入門 データ活用を促進する!プラットフォーム&データ品質の考え方」 斎藤友樹 著 技術評論社 2022
データを管理するための具体的な技術が詳しくまとまっています。


ビッグデータ分析のシステムと開発がこれ1冊でしっかりわかる教科書」 渡部徹太郎 著 技術評論社 2019
外部からデータを収集して、分析をする時に必要な分散処理の話が多めな感じです。 機械学習も少しあります。


その他

データ戦略と法律 攻めのビジネスQ&A」 中崎隆 他 編著 日経BP社 2021
弁護士のグループによるデータマネジメントを、Q&A集の形で解説しています。
契約の仕方や、個人情報など、データマネジメントの中でも、法律の知識が必要な部分について、解説しています。
データに関する法律問題は、データのライフサイクルと関連付けて検討すると良い。


ITガバナンス」 甲賀憲二・林口英治・外村俊之 著 NTT出版 2002
従来のガバナンスは「統治」という言葉から、暗い活動と思われて来たが、本来は、IT価値最大化のためのマネジメント活動。
ガバナンスの実体は、ITマネジメントプロセス、IT標準、IT組織。




順路 次は 問題解決と課題達成

Tweet データサイエンス教室