計量地理学 の分野などで、「空間統計学」というものがあります。
経済や、地理情報、地球の情報、病気の分布などに共通しているものとして、「位置情報」があります。 位置情報をうまくモデルに取り入れると、モデルの精度が上がります。 空間統計学は、こうした事を扱う手法です。
時系列解析 の 自己相関分析 では、近い時刻のデータとの相関を見ます。 空間統計学では、近い位置との関係を表現するのに、この見方を位置情報に使います。
位置が近いと近い性質を示したり(正の相関)、逆の性質を示したり(負の相関)になる事があるそうです。
ちなみに、 正の相関の時は、「近い情報に似ている」という事なので、 k近傍法 でも、予測の理論として扱えます。 負の相関の時は、k近傍法は苦手な話になってきます。
空間統計学の中で、 ベイズ統計 が使われ、その文脈でMCMC法が登場します。 MCMC法はもともと統計力学で発展しています。
この流れとは違うと思うのですが、 空間的に近いと、性質が同じになったり、逆になる理論は、統計力学の中にあります。 統計力学の場合は、空間的な近さのミクロな性質が、全体的な性質にどのように関わってくるのかが研究されています。 簡単なモデルとして、イジングモデルと言うものもあります。
磁石の理論の話になったりしています。 また、 数理生態学 で縄張りの研究に使われたりしていますので、地理学や経済学にも使われている理論です。
「空間統計学 :自然科学から人文・社会科学まで」 瀬谷創・堤盛人 著 朝倉書店 2014
地球統計学と空間計量経済学は、経緯は違うものの、空間データをモデルに取り入れる事でモデルの精度を高めるという点が、
共通しているそうです。
この本は、「空間統計学」として、両者を同じ本の中で統一的に論じる本として、おそらく世界で初の試みをしているそうです。
空間的自己相関は、近さに起因する相関。
負の自己相関は、植物が養分の奪い合いをしている時が例になる。
空間的な自己相関は、
時系列解析の中の、
自己相関分析と似ています。
時間には向きがありますが、空間にはない点が違っています。
空間データの特徴は、空間的自己相関と、地域の固有性や異質性。この本では、この性質の有無を
検定
する話もあります。
この本は、基本的に
回帰分析
の発展形で話がまとめられいるようです。
現実の空間データは、等分散性がなく、誤差同士に相関もあるので、通常の回帰分析は良くないそうです。
このため、重み行列を使います。
時空間自己回帰モデル(SpatioTemporal AutoRegressive model : STAR)には、時間的自己相関、空間的自己相関、それらの交互作用の項があります。
距離が近くて時間の古いデータの波及や、時間が近くて距離の遠いデータの波及を分けて扱えます。
このモデルはデータな時間的な向きも考慮します。
「空間データモデリング :空間統計学の応用」 間瀬茂・武田純 著 共立出版 2001
ランダム集合を使うと、「複雑な図形は、どのように測れば良いのか?」、という問題の答えが出るようです。
マルコフ確率場は、空間データ全般で重要な道具。
順路 次は ネットワーク