トップページ |
統計学の解釈学 |
このサイトについて
以下は、筆者の私見です。 誤解があれば、ご教示いただけると幸いです。
ARモデル は 時系列分析 の教科書で必ずと言って良いほど紹介されます。
このページでは、ARモデルについて、筆者が気が付いたことを説明します。 先行研究があるかもしれませんが、筆者は見かけたことがないです。
それは、下記の関係です。
「AR過程」と呼ばれることもありますが、上記のARモデルについて、aとqの値が決まっていて、それによって生成したデータがあったとします。 筆者が気が付いたのは、そのようなデータは、「一般化ランダムウォークモデル」とここで呼んでいるランダムウォークモデルの一種で表せることです。 aが1、bが0の時は、ランダムウォークモデルになります。
このページのタイトルは、「だいたい同じ」としています。
ARモデルは、aが大きいと無限大や無限小に発散しますが、そのようなケースは、当てはまらないようです。 また、季節性がある場合のように、隣接したサンプルが入らないARモデルは当てはまらないです。
ARモデルのデータを人工的に作ると、不規則な変化のグラフができるので、 「株価のデータなどで、実際に見かけるものと似ている。 だから、ARモデルは実際の現象に背後にあるのだ」というように思えてきます。
しかし、ARモデルとランダムウォークモデルが同じだとすると、背後にあるのは、ランダムウォークモデルの可能性もあります。
実際のところ、株価については、ある時点の金額に増減があって、次の時点の金額が決まるので、ランダムウォークモデルの方が合っています。
ARモデルを背後に持っている現象があると考えるのなら、グラフの見た目が似ていることでは判断できません。 具体的なメカニズムを紐解く必要があります。
ちなみに、筆者は、ARモデルのような式で次の値が決まっていくというのは、非常に不自然なので、現実に存在することはないと考えています。
「生成式」とした式を使って、データを約10000個作ります。 eの部分は、平均が0、標準偏差が1の乱数を使います。
推定式@は、必ず生成式が推定できるはずのモデルです。 n-1とn-2を使う生成式の場合は、作ったデータを1行ずらした変数と2行ずらした変数を作り、それらを説明変数として重回帰分析をすることで、推定式の係数を求めます。
推定式Aは、1行ずらした変数だけで同じことをしています。
係数の和が1で、すべての係数が1未満の場合は、aが1、bが0になり、ランダムウォークモデルになります。
係数の和が1で、n-1の係数が1以上の場合は、bがある程度大きな数になります。
係数の和が1未満の場合は、aが1より小さな数で、bが0になります。
この場合、誤差の影響が大きいので、Rが1よりもだいぶ小さいことがありますが、推定式@とAでは同程度なので、この場合も「ARモデルが、一般化ランダムウォークモデルと同じになる」と判断しました。
係数の和が1以上の場合、非常に早く無限大や無限小に発散するので、上記の方法では確認できませんでした。
