トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

データサイエンスの流派

筆者の場合は、 環境と品質 という分野に携わる中で、 データサイエンス を勉強して来ています。

例えば、品質管理の分野だと、「SQC」などと呼ばれて、数十年前に整備されたものがあるのですが、 筆者が実際に直面した問題を解決するには足りなかったため、役に立ちそうな方法やソフトは、できるだけ取り入れるようにして来ました。

データサイエンスには、「流派」と呼べるようなものがあります。 データサイエンス関係で仕事をしている人は、自分とは違う流派のことは、詳しくないことが多いです。

流派の分類はいろいろできそうですが、さしあたって思い当たる内容だと、4つに大きく分かれそうです。
データサイエンスの流派

機械学習・予測モデル

一番大きな流派です。

過去のデータを学習したモデルを作り、未来で起こることに活用しようとします。 「人工知能(AI)」と、一般の人が思うようなものでなくても、使われています。

Pythonの利用者が多いです。

この流派を将来やるつもりでデータサイエンスを勉強して、実際の仕事は他の流派の内容になっている人が、少なからずいらっしゃるかもしれません。

逆に、他の流派がメインだった分野で、この流派の技を取り入れている話もあります。 例えば、実験で統計学を使った化学では、 マテリアルズインフォマティクス・ケモメトリックス があります。

時系列解析

金融 関係では、不可解な動きをする値動きに対して、独自の研究があります。 時系列解析 の研究が盛んです。

因果推論

研究活動では、事実の検証に因果推論が活用されます。

回帰分析

計量経済学 関係では、 回帰分析 を応用した理論が多いです。

仮説検定・実験計画

医学や生物学の研究では、 仮説検定実験計画法 を活用して、少ないデータから、事実を裏付けようとします。

歴史が非常に古く、Rのライブラリが充実しています。

グラフ統計

製造業で整備された QC7つ道具・新QC7つ道具 は、 グラフ統計 を、多くの人が活用できるようにしています。

BI(ビジネスインテリジェンス)と呼ばれるツールは、業務で使うデータの分析や、監視に使われます。

期待値

保険・年金の事業では、商品設計に、昔から統計学が使われています。 特に期待値を計算することで、価格を決めるところが重要なようです。

くじや、ギャンブルも、この流派の一派です。

管理会計意思決定論 も、ここに入ります。

極値統計

極値統計 は、地震や津波など、非常に大きい時の対策が必要な分野の設計で活用されています。



データサイエンスの仕事データ分析の仕事



順路 次は 統計学

データサイエンス教室