トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

データサイエンス教室

データフィジクス(データ物理学)

統計学機械学習 の手法には、いろいろありますが、データを「数値」や「記号」として見ているものが多いです。

しかし、こういったデータの見方では、できる事が限られています。

物理学的な意味や性質が、どのようにデータに表れているのかを知っていると、より具体的な目的にデータが使えるようになってきます。 すでに方法論がいくつかあるものの、 データサイエンスの広大な未開拓地 のひとつです。

どういう性質のものかという事の他に、どういう事の結果として、そのデータの値が決まって来るのかまで踏み込むと、分析できる事が広がります。 また、こうしたアプローチは、自然言語やお金のような、物理学的な量ではないデータを扱う時にも役立ちます。

数理モデリング では、現象の数学的な表現(数理モデル)に注目しています。 データフィジクスは、現象がデータにどのように表れるのかに注目しています。 現象とデータの間に、必ずしも数理モデルが入りません。

2つの使い方

データフィジクスの使い方で比較的簡単なのは、 データの変換 の方法として使って、変換されたデータを統計モデルで扱うアプローチです。

もうひとつは、 モデル自体にデータフィジクスの考え方を取り入れるアプローチです。 特にデータフィジクスとは言われていませんが、例えば、下記の3つの手法は、 データフィジクスの考え方が取り入れられた手法と思います。 こういったものが汎用的なものでも、特定領域のものでも良いので、自分の目的に合わせて作れる人は、 「データサイエンティスト」かもしれません。

データフィジクスは総論よりも各論

データフィジクスは、すべてに共通するような総論よりも、 それぞれのデータに特有の各論が大事です。


順路 次は 物理量のデータ

Tweet