トップページ | Q&Aの一覧 | このサイトについて | ENGLISH

Q&A

Q(ご質問)

時刻が等間隔ではないのですが、どのように分析したら良いのでしょうか?
timedata

A(ご回答)

正確には等間隔ではないものの、この場合なら、等間隔とみなして分析しても良いと思います。 間隔を時刻の差として計算すると、下図のようになっていて、ほぼ1分間隔にはなっているので、1分間隔とみなせば良いです。
timedata

補足1

時系列解析 の方法には、データの表の並び方が、上から時刻の順になっていて、1行の違いが、例えば1分の違いを表していることを前提にしているものがあります。 計算の中で、時刻や時間の数字を直接扱わずに、データの並び方の規則を前提とした方法になっています。

上記のようなデータであることがわかっている時に、果たして等間隔を前提にした方法を使って良いのか?、というのがご質問の背景にあります。

補足2

下のグラフのような場合は、間隔が大きく空いているので、上記の考え方は使えないです。
timedata

この例の場合、値が高くなって、低くなることがひとつの周期になっているので、高くなり始める時からデータを取り始めて、 低くなったらデータの記録を止めているようです。

この周期の間に知りたい情報が入っているのでしたら、等間隔とみなして分析しても知りたいことに行き着けると思います。

この例の場合は、 各周期について、データが高くなり始める時の時刻を0として、そこからの時間を周期毎に計算する方法があります。 「高くなり始めからの時間」という特徴量になります。 応用として、低くなり切る時刻から遡った時間を計算して、「低くなりきるまでの時間」という特徴量を作ることもできます。

「各周期」を切り出す方法ですが、周期と周期の間のデータの記録のない時間を計算すると、「時間が〇〇以上は、周期の切れ目」という判断ができますので、 これをコードにして自動で集計する仕組みを作ります。

さらに、周期で切り出す方法を使うと、「各周期で最大値になるまでの時間」といった特徴量を作ることもできるようになって来ます。 工場の製造方法の分析で使える技です。


Tweet データサイエンス教室