時間や空間を直接扱う分野は、物理学の中では、かなり抽象度の高い分野です。
一方、 データフィジクス で、時間や空間を考慮する時は、かなり具体的な話になります。
時空間データには、コンピュータの中での扱い方の話と、分析方法の話があります。 時系列解析 や 再帰型ニューラルネットワーク(RNN) のように、理論としてかなり研究されているものもありますが、研究が進んでいるのは、ごく一部のようです。
時空間のデータは、表し方が大きく2つに分かれます。
ひとつは、具体的な時刻や、座標のデータとセットにして、点のデータとして扱う方法です。 連続している物を、ピンポイントで サンプリング したデータの集まりを扱うイメージになります。
もうひとつは、データの並び方が、時間や空間を表すようになっている方法です。 表や行列の形にします。 時空間を、碁盤の目のようにして区切って、区画ごとのデータを扱うイメージになります。 区画の大きさが同じことを前提とした理論や手法を使えるようになります。
後者の方法の一番すごいものが、テンソルです。 表(行列)では、2次元が限度ですが、その限界を超えられます。 時空間を一括して扱えます。
しかし、テンソルをコンピュータの中で扱うのは大変です。 テンソルを使うより、時空間の中で、知りたい側面だけを低次元のデータとして取り出した方が、手軽に分析が進められます。
時間の向きのあるデータには、隣のデータと値が近くなりやすい性質と、順番が決まっている性質があります。
古い手法としては、 時系列解析 の手法があります。
2つの時刻の差を計算して、時間のデータを作ると、分析できる事が、かなり増えます。 時刻と時間の扱い方 を駆使します。
意味のある2つの組み合わせを選ぶと、効果的です。
自然言語を単語に分解して分析する テキストマイニング は、かなり発展しましたが、単語の使われている順番は、あまり考慮されませんでした
自然言語では、単語の順序が重要ですが、 再帰型ニューラルネットワーク(RNN) がこの特徴を扱える手法になって来ています。
空間データには、隣のデータと値が同じになりやすい性質がある一方で、輪郭などでは、隣のデータと極端に値が異なる性質があります。
空間統計学 があります。
画像データは空間データの一種です。
画像データでは、この性質を利用した 畳み込みニューラルネットワーク(CNN) が急成長しました。
順路 次は 高次元のデータ