トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

データサイエンスの流派

筆者の場合は、 環境と品質 という分野に携わる中で、 データサイエンス を勉強して来ています。

例えば、品質管理の分野だと、「SQC」などと呼ばれて、数十年前に整備されたものがあるのですが、 筆者が実際に直面した問題を解決するには足りなかったため、役に立ちそうな方法やソフトは、できるだけ取り入れるようにして来ました。

データサイエンスには、「流派」と呼べるようなものがあります。 データサイエンス関係で仕事をしている人は、自分とは違う流派のことは、詳しくないことが多いです。

流派の分類はいろいろできそうですが、さしあたって思い当たる内容だと、5つに大きく分かれそうです。
データサイエンスの流派

機械学習・予測モデル

一番知られている流派です。

過去のデータを学習したモデルを作り、未来で起こることに活用しようとします。 「人工知能(AI)」と、一般の人が思うようなものでなくても、使われています。

Pythonの利用者が多いです。

この流派を将来やるつもりでデータサイエンスを勉強して、実際の仕事は他の流派の内容になっている人が、少なからずいらっしゃるかもしれません。

逆に、他の流派がメインだった分野で、この流派の技を取り入れている話もあります。 例えば、実験で統計学を使った化学では、 マテリアルズインフォマティクス・ケモメトリックス があります。

時系列解析

金融 関係では、不可解な動きをする値動きに対して、独自の研究があります。 時系列解析 の研究が盛んです。

因果推論

研究活動では、事実の検証に因果推論が活用されます。

回帰分析

計量経済学 関係では、 回帰分析 を応用した理論が多いです。

仮説検定・実験計画

医学や生物学の研究では、 仮説検定実験計画法 を活用して、少ないデータから、事実を裏付けようとします。

歴史が非常に古く、Rのライブラリが充実しています。

グラフ統計学

製造業で整備された QC7つ道具・新QC7つ道具 は、 グラフ統計 を、多くの人が活用できるようにしています。

BI(ビジネスインテリジェンス)と呼ばれるツールは、業務で使うデータの分析や、監視に使われます。

現象統計学

林知己夫氏は、統計学の大家ですが、林氏が切り開いた分野を、筆者は「現象統計学」と呼んでいます。 林氏は、実際に起きている現象から離れて、理論が精緻になるように発展した統計学のあり方には、賛同されていませんでした。 また、サンプル数が大きければ、どんなに小さな差でも有意になってしまうという、検定の理論にも懐疑的でした。

林氏は、統計学の専門家という立場ですが、主は、政治、社会、法律、文化、医学といった分野についてで、副が統計学という形でした。 それぞれの分野で解明したいテーマがあり、そのために統計的な調査方法や、統計的なデータの処理の方法を開発しています。 方法が先にあり、それにテーマを合わせる進め方はしていません。

現象統計学のうち、医学については、アプローチが因果推論です。

政治、社会、法律、文化については、 アンケートでデータを集めて、 尺度構成法因子分析 などで、定量的に分析するアプローチが使われることが多いです。

期待値

保険・年金の事業では、商品設計に、昔から統計学が使われています。 特に期待値を計算することで、価格を決めるところが重要なようです。

くじや、ギャンブルも、この流派の一派です。

管理会計意思決定論 も、ここに入ります。

極値統計

極値統計 は、地震や津波など、非常に大きい時の対策が必要な分野の設計で活用されています。



データサイエンスの仕事データ分析の仕事



参考文献

現象統計学

現象をさぐる データの科学」  林知己夫 著 林知己夫著作集編集委員会 編 勉誠出版 2004
現象の解明を目的とした時の統計学のあり方や、データの集め方を解説しています。


確率と統計  基礎から応用まで」  林知己夫 編著 旺文社 1980
統計学の教科書。社会調査など、具体的な諸分野への応用が半分以上


統計理論入門」  佐藤良一郎・林知己夫, 青山博次郎 著 新光閣書店 1964
最初の2/3で、統計量、検定、推定。残りが調査法


工業統計 新しい経営管理のあり方」  青山博次郎・林知己夫 編著 産業図書 1956
管理図、実験計画、サンプリング、最適化計算、市場調査
検定は、サンプル数が大きいと、それだけで有意になることを指摘している。


計量的研究 我が国人文・社会科学研究の最近の動向」  林知己夫 編 南窓社 1974
因子分析や、尺度構成法が使われている


多次元尺度解析法 その有効性と問題点」  林知己夫・飽戸弘 編 サイエンス社 1976
多次元尺度構成法の、様々な理論の説明


多次元尺度解析法の実際」  林知己夫 編著 サイエンス社 1984
お化け、死生観、価値構造、政治意識への研究例


計量感覚 役立つ情報をつかみ出すために」  林知己夫 著 プレジデント社 1978
データを取って現象を解明するアプローチを重ねて来た著者による、合理化、国際化、環境問題といったことへの考察


日本人の国民性」  統計数理研究所国民性調査委員会 編 出光書店 1982
国民性についての意識調査


日本人の深層意識」  林知己夫・米沢弘 著 日本放送出版協会 1982
日本人の関心ごとの調査


日本人の心をはかる」  林知己夫 著 朝日新聞社 1988
国民性の研究


比較日本人論 日本とハワイの調査から」  林知己夫 編 中央公論社 1973
アンケート調査と数量化理論による分析


日本と東南アジアの文化摩擦」  林知己夫・穐山貞登 編 出光書店 1982
アンケート調査と数量化理論による分析


森林をみる心 「森林と文化」国際シンポジウムからの報告」  四手井綱英・林知己夫 編著 共立出版 1984
森林について、日本、ドイツ、フランスにおける意識の研究


市場調査の計画と実際」 林知己夫・村山孝喜 共著 日刊工業新聞社 1964
サンプリング、質問票、数量化理論による市場調査


世論調査の現状と課題」 輿論科学協会 編 至誠堂 1977
アンケートなどの調査法について


日本人にとって法とは何か」 日本文化会議 編 研究社出版 1974
法についての意識調査をするための、調査方法の設計に林先生が参加。
意識について、アンケートで何でも測れるわけではないが、測れるものについては、その範囲については明確なことがわかる、というスタンス


健康管理の計量化 とくにがん・循環器疾患のリスクファクターを考える」 林知己夫 編 共立出版 1984
疫学における原因分析


科学と常識」 林知己夫 著 東洋経済新報社 1982
医学、行政、哲学と統計的な考え方の関係。
著者は、サンプルが多ければ何でも棄却されてしまうことから、検定は理論としておかしいと考えている。統計量ではなく、多次元データの研究を現象の解明の中心にしている。


あいまいさを科学する トワイライト・カテゴリーへの招待」 林知己夫 他 著 講談社 1984
直感、ガン、動物の文化などのテーマを通して、研究のあり方を考察




順路 次は 統計学