データサイエンスの道具(G7・W7・M7)
QC7つ道具・新QC7つ道具(Q7・N7)
のページに、これらの道具の使いにくさ、わかりにくさも書いてあります。
それもあり、G7・W7・M7は、
データサイエンス
の基本的な道具として、筆者がまとめてみたものです。
G7・W7・M7のもともとのアイディアは、Q7・N7から来ています。
G7・W7はデータサイエンスの初級向け、
M7は中級向けのつもりです。
G7
G7の「G」は、「Graphs of Numbers:数値のグラフ」から取りました。
G7は、
Q7
に近いです。
G7でも、データを有効に分析するための方法として、
層別
はポイントです。
「層別のヒストグラムと、箱ひげ図のどちらを使うか?」、「散布図とヒートマップのどちらを使うか?」、等は、
文章で説明するとなると、小難しいことになります。
実際のデータに使ってみて、解析の目的や、見やすさ等で、その時その時で使い分ければ良いと思います。
-
棒グラフ : 量の大小を見る(重要項目を見るために、多い順に並べたものは、「パレート図」と呼ばれる)
-
折れ線グラフ : 時間的な変化を見る。(「管理図」は折れ線グラフの一種)
-
円グラフ : 割合を見る
-
ヒストグラム : (1つの変数で表現される)分布を見る。(棒グラフの一種)
-
箱ひげ図 : (1つの変数で表現される)分布を見る。(層別のヒストグラムと用途が近い)
-
散布図 : 2つの変数の関係を見る。2つの変数で表現される分布を見る。(まれなケースの発見や、データ数が比較的少ない時用)
-
ヒートマップ : 2つの変数の関係を見る。2つの変数で表現される分布を見る。(データ数が比較的多い時用)
W7
W7の「W」は、「Analisis of Words:言葉の分析」から取りました。
定性分析(
概念分析
)が多いです。
概念だけの分析と、数値データも多少含む分析があります。
-
親和図 : アイディアを分類する方法。
ブレーンストーミング
をまとめる方法。
-
特性要因図 : 親子関係をまとめる方法。手書きでのデータ収集の方法。
-
系統図(ロジックツリー) : 系統的に分類して、具体的な内容に結びつける方法。
FMEA
に似ています。
特性要因図の次の段階にも使えます。
-
連関図 :
関係を矢印を使った図で表す。
システム思考
で中心的存在
-
マトリックス図 : 関係の度合や、優劣を、表形式にしてまとめる方法。
関係の度合いは、○×の場合もあれば、点数で表現することもあります。
「星取り表」とも呼ばれています。
QFD(品質機能展開)
では、「二元表」と呼ばれています。
-
アローダイヤグラム : 日程計画の方法
-
フローチャート : N7では「PDPC」と呼ばれます。
判断を伴う計画に使われることもありますし、作業のプロセスを目に見える形にする事に使われる事もあります。
なぜなぜ分析
は、いろいろな概念分析の基本になっています。
W7では、物事の階層構造(木構造)やネットワーク構造を考えます。
表に出ることは少ないですが、システムの2大構造(木構造とネットワーク構造)は、G7やM7でも使います。
M7
M7の「M」は、「Mathematical Analisis:数理的な分析」から取りました。
順路
次は
パレート図