トップページ |
ひとつ上のページ |
目次ページ |
このサイトについて | ENGLISH
このページでは、典型的な例として、 SARIMAXTモデル や 三重指数平滑法 を「 時系列分析 」として想定します。 また、 決定木 などの 教師あり学習 の方法を「 機械学習 」として想定します。
機械学習でも、時系列を表す変数を加えると、時系列分析の一種になりますが、ややこしくなるので、そのケースはここでは外します。
上記のように、時系列分析と機械学習を分けます。 両者は、予測の方法として使われることが一般的ですが、共通点と相違点があります。
いずれもブラックボックスのモデルになります。 つまり、もっともらしい予測の値を出すことはできますが、その現象のことについては、何も知ることができない方法です。
モデルの係数が決まって、精度が高いことは、数字の当てはまりが良いだけであり、現象のメカニズムについて、何かがわかる訳ではないです。
例えば、下のグラフは、過去7日間の売上を表しています。
このグラフだけを見て、8日目を予測するとしたら、「おそらく、平均の2200円くらいだろう。
もしかしたら、1000円くらいかもしれないし、4000円くらいになるかもしれない。」
となります。
ところが、下のグラフだとしたら、
「おそらく、1000円以下だろう」となります。
上の2つの予測のうち、ひとつめが機械学習によるものです。 ふたつめが時系列分析によるものです。
まず、予測値の範囲が違います。 時系列分析の方が、狭い範囲について、高い可能性を予想しています。
次に、「1000円以下」という、過去のデータよりも、さらに低い金額を確信を持って予測するところが違います。
上記の違いがあるので、実務向けの予測方法としては、時系列分析に軍配が上がります。
機械学習では、「いつでも成り立っている法則」を見つけようとします。 そのため、時刻のデータがあったとしても、モデルには含めないことが多いです。
順路
次は
状態解析
