トップページ | Q&Aの一覧 | このサイトについて | ENGLISH

Q&A

Q(ご質問)

このデータに、一番良いモデルは?
time series
※ いただいたデータをそのままここで紹介する訳にはいきませんので、似たものを作ってグラフにしています。

A(ご回答)

モデルの良さは、課題の内容によって異なります。 パッと思い付いた範囲ですが、ご質問の背景にある課題は、以下の3通りがあるように思いました。

直近の予測をしたい場合

送っていただいたデータは、時系列データで、隣の時刻のデータとは、それほど離れない範囲で変化しています。 また、 短期間の変動に比べて、全期間の変動はかなり大きいです。 そのため、一番簡単で、それなりに精度の高い予測値を求める方法としては、直前の時刻の値をそのまま予測値にする方法が考えられます。
time series

多少、予測値の精度を上げるのでしたら、次の段階としては、20個周期で周期性が見えているので、この周期でモデルを作ると良いです。 入れ方は、いくつか考えられます。
time series

time series

遠い未来の予測をしたい場合

送っていただいたデータは、 前半が、周期性を除くと、ほぼ一定値になっているようです。 後半は、周期性を除くと、一定の増分で右肩上がりに増えている形になっています。

直近の予測をするためのモデルは、直近のデータを予測値に使うため、直近の予測には良いのですが、 このデータの長期間の特徴がモデルに入っていないため、遠い未来の予測には使えません。

データを見る限りでは、右肩上がりの期間は、一定の増分で上がり続けているため、このまま上がり続けるという仮定をおけば、 遠い未来の予測に使えるモデルが作れます

長期の予測の一番簡単で、だいたい合っている予測値を得る方法としては、右肩上がりの期間のデータだけで、 単回帰分析をする方法が考えられます。

こちらも、周期性を入れると予測値の精度が上がることは考えられますが、 「右肩上がりが続く」という、思い切った前提条件を置いていますので、細かい精度にこだわっても、あまり意味がないように思います。

データに当てはまりがもっとも良いモデルを求めたい場合

ReLU関数との組み合わせで、目的は達成できるかと思います。
time series

このモデルは、直近の予測には使えると思いますが、遠い未来の予測に使う場合は、「右肩上がりが続く」という前提があることに注意が必要です。



Tweet データサイエンス教室