杉原データサイエンス事務所のロゴ トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

予測の方法としての、時系列分析と機械学習の違い

このページでは、典型的な例として、 SARIMAXTモデル三重指数平滑法 を「 時系列分析 」として想定します。 また、 決定木 などの 教師あり学習 の方法を「 機械学習 」として想定します。

機械学習でも、時系列を表す変数を加えると、時系列分析の一種になりますが、ややこしくなるので、そのケースはここでは外します。

上記のように、時系列分析と機械学習を分けます。 両者は、予測の方法として使われることが一般的ですが、共通点と相違点があります。

共通点

いずれもブラックボックスのモデルになります。 つまり、もっともらしい予測の値を出すことはできますが、その現象のことについては、何も知ることができない方法です。

モデルの係数が決まって、精度が高いことは、数字の当てはまりが良いだけであり、現象のメカニズムについて、何かがわかる訳ではないです。

相違点

例えば、下のグラフは、過去7日間の売上を表しています。 このグラフだけを見て、8日目を予測するとしたら、「おそらく、平均の2200円くらいだろう。 もしかしたら、1000円くらいかもしれないし、4000円くらいになるかもしれない。」 となります。
Excelによる予測モデル

ところが、下のグラフだとしたら、 「おそらく、1000円以下だろう」となります。
Excelによる予測モデル

上の2つの予測のうち、ひとつめが機械学習によるものです。 ふたつめが時系列分析によるものです。

まず、予測値の範囲が違います。 時系列分析の方が、狭い範囲について、高い可能性を予想しています。

次に、「1000円以下」という、過去のデータよりも、さらに低い金額を確信を持って予測するところが違います。

上記の違いがあるので、実務向けの予測方法としては、時系列分析に軍配が上がります。

機械学習の特徴

機械学習では、「いつでも成り立っている法則」を見つけようとします。 そのため、時刻のデータがあったとしても、モデルには含めないことが多いです。



順路 次は 状態解析


杉原データサイエンス事務所のロゴ
杉原データサイエンス事務所によるコンサルティングとセミナー