筆者の場合は、 環境と品質 という分野に携わる中で、 データサイエンス を勉強して来ています。
例えば、品質管理の分野だと、「SQC」などと呼ばれて、数十年前に整備されたものがあるのですが、 筆者が実際に直面した問題を解決するには足りなかったため、役に立ちそうな方法やソフトは、できるだけ取り入れるようにして来ました。
データサイエンスには、「流派」と呼べるようなものがあります。 データサイエンス関係で仕事をしている人は、自分とは違う流派のことは、詳しくないことが多いです。
流派の分類はいろいろできそうですが、さしあたって思い当たる内容だと、4つに大きく分かれそうです。
一番大きな流派です。
過去のデータを学習したモデルを作り、未来で起こることに活用しようとします。 「人工知能(AI)」と、一般の人が思うようなものでなくても、使われています。
Pythonの利用者が多いです。
この流派を将来やるつもりでデータサイエンスを勉強して、実際の仕事は他の流派の内容になっている人が、少なからずいらっしゃるかもしれません。
逆に、他の流派がメインだった分野で、この流派の技を取り入れている話もあります。 例えば、実験で統計学を使った化学では、 マテリアルズインフォマティクス・ケモメトリックス があります。
金融 関係では、不可解な動きをする値動きに対して、独自の研究があります。 時系列解析 の研究が盛んです。
研究活動では、事実の検証に因果推論が活用されます。
計量経済学 関係では、 回帰分析 を応用した理論が多いです。
医学や生物学の研究では、 仮説検定 や 実験計画法 を活用して、少ないデータから、事実を裏付けようとします。
歴史が非常に古く、Rのライブラリが充実しています。
製造業で整備された QC7つ道具・新QC7つ道具 は、 グラフ統計 を、多くの人が活用できるようにしています。
BI(ビジネスインテリジェンス)と呼ばれるツールは、業務で使うデータの分析や、監視に使われます。
保険・年金の事業では、商品設計に、昔から統計学が使われています。 特に期待値を計算することで、価格を決めるところが重要なようです。
くじや、ギャンブルも、この流派の一派です。
極値統計 は、地震や津波など、非常に大きい時の対策が必要な分野の設計で活用されています。
順路 次は 統計学