トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

経時解析

経時解析は、時間によって起こる変化の 時系列解析 です。 始まりと終わりの期間がある現象について、変化の様子を調べたい時に使います。 例えば、スイッチを押してからの状態の変化のデータや、 薬を飲んでからの症状の変化のデータです。

下記で、分散分析、決定木、回帰分析を使った解析が出て来ますが、 解析の説明変数(X)は、「時間」です。

分散分析・決定木

「初日、1ヶ月後、2ヶ月後、3ヶ月後」のような時間で測定されたデータの場合、 時点数(測定回数)が少ないので、Xは、 質的データ として扱うことができます。

時点数が多い場合でも、期間を区切って、区間毎に初日、1ヶ月後、2ヶ月後、3ヶ月後のような名前を付けたり、 初日、1ヶ月後、2ヶ月後、3ヶ月後のタイミングのデータだけを解析対象にすると、 この方法が使えます。

Xが、質的データになっていると、 分散分析 や、 決定木 を使うことができます。

これらの手法を使うと、「時間の経過とともに変化が起きている。」といえるのかが解析できます。

ちなみに、 決定木 のソフトには、自動で時点数の期間を区切ってグループ化する方法が入っていることがあります。

回帰分析

「だんだん増加している」とか、「一度低下して、再び上昇する」といった現象を式で表す時には、 回帰分析 を使うことができます。

回帰分析の時のXは、量的データとして使います。

一般的な回帰分析は、 線形式 の形で解析することが多いと思いますが、 時間変化の解析では、カーブした線で近似した方が良いこともありますので、 二次以上の式や指数を使うこともあります。

パネルデータ分析・差の差分析

計量経済学 でよく紹介されるパネルデータ分析や、差の差分析は、経時解析の一種です。




参考文献

医学の分野では、成長に伴う身体の変化や、薬物投与後の時間変化のデータを、 「経時データ」や「縦断データ」と呼んでいるようです。


経時データ分析」 藤越康祝・菅民郎・土方裕子 著 オーム社 2008
どんなデータをどのように分析するのかが、入門者向けに書かれています。 分散分析モデル、成長曲線モデル(回帰分析のモデル)、ランダム係数モデル等が解説されています。
ランダム係数モデルというのは、 サンプル毎に測定回数が違っている場合を、 状態空間モデル に近い2階層の式で表現します。


経時データ解析の数理」 藤越康祝 著 朝倉書店 2009
上記の本を、専門家用に書き直したような書き方の本です。


縦断データの分析 変化についてのマルチレベルモデリング」 Judith D.Singer, John B.Willett 著 菅原ますみ 監訳 朝倉書店 2009
マルチレベルモデルを詳細に解説しています。


発達心理学のための統計学 縦断データの分析」 宇佐美慧・荘島宏二郎 著 誠信書房 2015
データの欠測について、種類や対処法に1章を充てています。
構造方程式モデリング(SEM) : 時点間の平均値の差の分析法
潜在成長モデル(latent growth model) : SEMに傾きも考慮したモデル
他に 自己回帰モデル もあります。




順路 次は 多変量データの傾向解析

データサイエンス教室