時間軸に沿って変化している現象の解析を、時系列解析と言います。 「動的」や「ダイナミクス」と言われる現象の解析です。
時系列解析としては、物体の動きや、温度や株の変動のようなデータがイメージされることが多いと思います。 しかし、例えば、工場の中では、装置のログデータや、MES(Manufacturing Execution System : 製造実行システム)のデータ解析も、 時系列解析の一種と言えます。
時系列解析では、時間軸の変化の扱い方で、いろいろなアプローチがあります。
「時系列解析」を特に意識していなくても、たいていのデータは、時間軸と何らかの関係があります。 時系列解析の考え方は、 データサイエンス の中では、いつも頭のどこかに置いてあると良いです。
下記は、時刻や時間のデータを扱う時に使う、 データリテラシー の技です。
現象を数値化して解析する手法には、 現象の特徴や知りたいことによって、種類があります。
筆者の知る限りでは、「時系列解析」や「時系列分析」がタイトルになっている文献は、 このサイトで言うところの「 自己相関分析 」、「 点過程 」、「 スペクトル解析 」の話が書かれています。 このサイトは、「時系列解析」という言葉の本来の意味に則って、時系列解析をまとめてみました。
時系列データを、いわゆる「時系列解析」でモデル化しようとした時に、 うまくいかなかった経験を持っている方は、多いのではないかと思います。 モデル作りの根本的な話については、 順問題と逆問題 や、 現実と統計モデルとのギャップ にまとめてみました。
経時解析 ・ 自己相関分析 ・ スペクトル解析 では、手持ちのデータを使って、そのデータをもっともよく表すモデル式を作ろうとします。 しかし、良い式が見つからないことは、よくあります。 特に、重回帰式のような式を、そのまま当てはめようとすると、うまく行くことはあまりないようです。
「指数関数の関係がある」、「あるXを、あるXで割った値を使うと、Yとの関係が単純な形で表せる」、 等、扱っている現象の物理的な内容を知っていると、うまく当てはまることがあります。 物理知識を使って、データを加工してから当てはめます。
システムダイナミクス は、現象の数式を組み立てて、その現象の時間的な変化をシミュレーションします。 当てはまりの良いモデル式を、物理的な内容を踏まえて探すアプローチとは、相補的な関係です。
ディープラーニング の仲間として、 再帰型ニューラルネットワーク(RNN) が登場して来ています。
ディープラーニングと言えば、画像認識の技術として有名ですが、 RNNは、時系列データを扱えるようにしたディープラーニングです。
音声認識 や 自動作文 などの自然言語処理での利用が進んでいますが、 もっと広く、時系列データを扱う手法として普及すると思っています。
順路 次は 状態解析