「加速度、速度、距離」。これらは、「時間」で微分したり、積分したりする事で、お互いが求まります。
「長さ、面積、体積」。これらは、「長さ」で微分したり、積分したりする事で、お互いが求まります。
こういった話は、高校の数学の話なので、いわゆる理系の勉強をして来た人は、よく知っている話と思います。 しかし、勉強以外でこういった知識が必要になる人は、とても少ないです。
ところで、データ解析をする時には、こういった知識が威力を発揮する事があります。
数学の勉強の中での微分や積分は、式の変形が中心になりました。 一方、データ解析の中での微分や積分は、データそのものを扱う事が中心になります。
下記の例は、足し算、引き算、掛け算、割り算で求まる簡単なものですが、 数値積分 としては、精度の高い計算や、複雑な積分も知られています。
1時間おきの「距離」のデータがあった時、前の時刻との差を計算すると、「時速」という単位の量が求まります。
こういう計算は「差分」と呼ばれますが、「微分」のように使うこともできます。
1時間おきの「時速」のデータがあって、7時から9時まで「5 km/時」で一定値の場合、
5 * ( 9 - 7 ) = 5 * 2 = 10
という計算で、10kmという「距離」が求まります。
ある区間の値の合計値は、累積値と呼ばれます。 合計値や累積値は、積分値の一種として使えます。
何で微分するか、あるいは、どのデータの範囲で何で積分するかで、 「何もわからないデータ」や「役に立たないデータ」が「貴重なデータ」に化ける事があります。
例えば、ダムの貯水量のデータがなかったとしても、ダムに流れ込む水の流量(単位時間あたりに流れる量)がわかれば、 貯水量が計算でわかったりします。
2次データの解析 や 3次データの解析 で、どういう形のデータになっていると良いのかをイメージすると、 どういう風に微分や積分をするのかが決めやすいです。
例えば、毎日の周期で起きていることを調べる時に、「開店時刻から閉店時刻までのデータを積分する」という感じです。
センサーデータの解析の場合は、「時間」で微分や積分をすると良い事が多いです。
微分・積分を学ぶと、「無限小の極限を考えます」という意味の説明が、登場します。 ところが、コンピュータで無限小という数値は扱えないので、 「無限小とみなしても良い位小さな数値」を使います。 これによって、小さな数値を使う近似式を作ります。 この近似が、数値計算の考え方のポイントです。
順路 次は 差分データ(速度データ)