トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

機械学習による自然科学

自然科学とデータサイエンスの関係には、長い歴史があります。

その歴史の中に機械学習も入って来ています。従来からの自然科学の研究に、機械学習の手法を応用する研究が進んでいます。
機械学習と自然科学のコラボレーション

膨大な研究データ（ビッグデータ）の分析

研究の種類によっては、データが膨大になることがあります。膨大なデータの効率的な利用に、機械学習を活用するアプローチもあります。

画像分析、テキスト分析、遺伝子分析、マテリアルズインフォマティクス・ケモメトリックスなどがあります。

複雑な現象の近似計算

機械学習を自然科学の研究に活用していく話は、膨大な研究データ（ビッグデータ）の分析の話の方が、複雑な現象の近似計算の話よりも、歴史的には早いようです。

自然科学では、シンプルでわかりやすい数式を発見して利用します。

ところが、数式はシンプルでも、それを具体的な現象に対して使おうとすると、計算が膨大になることがあります。例えば、実際の物質のような膨大な数の原子が入っているものに対して、原子の数式を使う場合や、実際の機械の形や地形に対して、流体の数式を使う場合です。

計算の中身ではなく、計算結果の価値が高い場合に、自然科学的に正確な式の部分を機械学習で近似する方法があります。

膨大な研究データの分析に機械学習を使う場合は、データに対して機械学習の手法を当てはめていく進め方をしますが、複雑な現象の近似計算に機械学習を使う場合は、近似の対象とする数式やモデルを念頭に起きながら、どこを近似するのかも考えていく進め方が多いようです。

ニューラルネットワークによる現象の近似

ニューラルネットワーク（ディープラーニング（深層学習））には、どんな複雑なデータでも、それを表す数式を近似的に導ける特徴があります。

物理学に基づいたニューラルネットワーク

物理学に基づいたニューラルネットワーク（Physics-Informed Neural Network）は、ニューラルネットワークの式に、物理法則の式を含めることで、精度の高いニューラルネットワークのモデルを作る方法です。

物理法則の式を直接扱うシミュレーションでは、計算が膨大になる場合に、このアプローチの方が良いことがあるようです。

ニューラルネットワーク

ニューラルネットワークは、生物の中の情報伝達や学習の仕組みの研究が、機械学習として使われるようになったものです。

今は、ニューラルネットワークの数理が、自然界の現象を記述する方法として応用されるようになって来ています。

参考文献

「ディープラーニングと物理学」田中章詞・富谷昭夫・橋本幸士著　講談社　2019
物理学については大学の物理学科くらいのレベルの話が普通にされています。ディープラーニングについては、入門書より高度な内容があります。両方を自在に行き来しながら、解説されています。
大変な内容が詰め込まれていますが、個々の説明はコンパクトで、本全体がよく体系化されている感じでした。
前半で、物理学的な進め方で、ニューラルネットワークの数理を導き出しています。後半は、ディープラーニングを使った物理学になっています。
ResNetは、迂回路を持たせることで、学習の効率を向上させたニューラルネットワーク。迂回路とは、入力を出力にそのまま合流させたものをひとつの項にすること。このモデルは、微分方程式を離散化したものと解釈できる。そして、ResNetが、物理学でよく使われる微分方程式をニューラルネットワークに結び付ける突破口になる。（ちなみに、 ARモデルとその発展形にも似たアイディアがあります。前の時刻との差分を、目的変数として使うと、良いモデルが作られる場合があることは、時系列解析では、かなり前からあります。）

「物理学者、機械学習を使う」橋本幸士　編　朝倉書店　2019
この本では、機械学習とニューラルネットワーク（ディープラーニング）は、同じ意味で扱っています。
学習を「非線形関数の最適化」と捉えています。
ニューラルネットワークと物理学の親和性が高いこととして、３点挙げています。
・天体観測の画像は膨大な量があり、その分析に役に立つ。
・スピン系の物理は、２値の状態を扱うので、ニューラルネットワークと親和性が高い。
・物理系は、微分方程式で記述され、微分方程式をコンピュータで扱う時は差分方程式にするが、差分方程式はニューラルネットワークと親和性が高い。ニューラルネットワークを物理空間と考える。層の深さは、離散化した空間や時間の方向と考えたり、繰り込み群の方向と考える。
この本は、物理学のテーマに機械学習を応用する話と、機械学習関係のテーマに物理学を応用する話があります。後者は、量子アニーリングや量子計測です。
第2章：量子多体系は、莫大な数の変数で記述されることになるため、計算が困難になる。これをニューラルネットワークで近似する。ニューラルネットワークは、原理的にどんな非線形関数でも表現できることと、量子多体系の何らかの特徴量を表現できるのなら、そこまで大きなモデルにならないはず、というのがアイディア。

「これならわかる機械学習入門」富谷昭夫著　講談社　2021
物理学科の学生が、研究手法のひとつとして機械学習を学んでいくための教科書です。
これ１冊で高校程度の数学から畳み込みニューラルネットワークまでつながり、Pythonでの実装も解説しています最後の30ページほどで、機械学習を使ってイジングモデルを使った相転移を研究した事例が紹介されています。

「物理のためのデータサイエンス入門」植村誠　著　講談社　2023
データサイエンスの一般的な本と同じような内容が中心ですが、物理現象の計測への応用もあります。実験データの統計的な扱い方や、モデルの作り方にデータサイエンスが役立っています。

物理学に基づいたニューラルネットワーク

「So, what is a physics-informed neural network?」 BEN MOSELEY　2021
https://benmoseley.blog/my-research/so-what-is-a-physics-informed-neural-network/
英語ですが、シンプルに解説しています。

「話題のNVIDIA SimNet?でも使われているPhysics-Informed Neural Networkについて調べてみたら、深過ぎたので「自由落下」問題をPhysics-Informedしてみた。」 @nnnnnnn(日産自動車（株）)　2021
https://qiita.com/nnnnnnn/items/df62e9fb0ec999df96a2
Physics-Informed Neural Networkの数少ない日本語の解説です。

順路次は生態系