杉原データサイエンス事務所のロゴ トップページ | 統計学の解釈学 | このサイトについて

ARモデルと一般化したランダムウォークモデルは、だいたい同じ

以下は、筆者の私見です。 誤解があれば、ご教示いただけると幸いです。


ARモデル時系列分析 の教科書で必ずと言って良いほど紹介されます。

このページでは、ARモデルについて、筆者が気が付いたことを説明します。 先行研究があるかもしれませんが、筆者は見かけたことがないです。

それは、下記の関係です。
ARモデルと一般化したランダムウォークモデル

「AR過程」と呼ばれることもありますが、上記のARモデルについて、aとqの値が決まっていて、それによって生成したデータがあったとします。 筆者が気が付いたのは、そのようなデータは、「一般化ランダムウォークモデル」とここで呼んでいるランダムウォークモデルの一種で表せることです。 aが1、bが0の時は、ランダムウォークモデルになります。

「だいたい同じ」とは

このページのタイトルは、「だいたい同じ」としています。

ARモデルは、aが大きいと無限大や無限小に発散しますが、そのようなケースは、当てはまらないようです。 また、季節性がある場合のように、隣接したサンプルが入らないARモデルは当てはまらないです。

同じだと、何が言えるのか

ARモデルのデータを人工的に作ると、不規則な変化のグラフができるので、 「株価のデータなどで、実際に見かけるものと似ている。 だから、ARモデルは実際の現象に背後にあるのだ」というように思えてきます。

しかし、ARモデルとランダムウォークモデルが同じだとすると、背後にあるのは、ランダムウォークモデルの可能性もあります。

実際のところ、株価については、ある時点の金額に増減があって、次の時点の金額が決まるので、ランダムウォークモデルの方が合っています。

ARモデルを背後に持っている現象があると考えるのなら、グラフの見た目が似ていることでは判断できません。 具体的なメカニズムを紐解く必要があります。

ちなみに、筆者は、ARモデルのような式で次の値が決まっていくというのは、非常に不自然なので、現実に存在することはないと考えています。

仮説の検証の仕方

「生成式」とした式を使って、データを約10000個作ります。 eの部分は、平均が0、標準偏差が1の乱数を使います。

推定式@は、必ず生成式が推定できるはずのモデルです。 n-1とn-2を使う生成式の場合は、作ったデータを1行ずらした変数と2行ずらした変数を作り、それらを説明変数として重回帰分析をすることで、推定式の係数を求めます。

推定式Aは、1行ずらした変数だけで同じことをしています。

係数の和が1で、すべての係数が1未満の場合

係数の和が1で、すべての係数が1未満の場合は、aが1、bが0になり、ランダムウォークモデルになります。
ARモデルと一般化したランダムウォークモデル


ARモデルと一般化したランダムウォークモデル


ARモデルと一般化したランダムウォークモデル


ARモデルと一般化したランダムウォークモデル

係数の和が1で、n-1の係数が1以上の場合

係数の和が1で、n-1の係数が1以上の場合は、bがある程度大きな数になります。
ARモデルと一般化したランダムウォークモデル


ARモデルと一般化したランダムウォークモデル


ARモデルと一般化したランダムウォークモデル


ARモデルと一般化したランダムウォークモデル


ARモデルと一般化したランダムウォークモデル

係数の和が1未満の場合

係数の和が1未満の場合は、aが1より小さな数で、bが0になります。

この場合、誤差の影響が大きいので、Rが1よりもだいぶ小さいことがありますが、推定式@とAでは同程度なので、この場合も「ARモデルが、一般化ランダムウォークモデルと同じになる」と判断しました。
ARモデルと一般化したランダムウォークモデル


ARモデルと一般化したランダムウォークモデル


ARモデルと一般化したランダムウォークモデル


ARモデルと一般化したランダムウォークモデル


ARモデルと一般化したランダムウォークモデル

係数の和が1以上の場合

係数の和が1以上の場合、非常に早く無限大や無限小に発散するので、上記の方法では確認できませんでした。



ARモデルの係数の決まり方

平滑化したランダムウォークモデルになるARモデル




杉原データサイエンス事務所のロゴ
杉原データサイエンス事務所によるコンサルティングとセミナー