トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

重ならない窓

移動窓 といえば、 重なる窓が一般的と思います。 窓の枠を少しずつずらして行き、その窓の中のデータについて、平均値や相関係数などを計算する方法です。
重なる窓

一方で、重ならない窓というのもあります。
重ならない窓

重ならない窓の例

重ならない窓のわかりやすい例は、「毎月の売上高」、「毎月の平均気温」といった集計値です。 この場合は、月の変わり目が窓の枠になっています。 0-1データの時系列解析 は、この例の応用です。

イベント発生から、次のイベント発生までを窓の枠にすることもできます。 センサーデータの解析 にある 2次データ は、このイベントを工場の生産の周期にしたものになっています。

重ならない窓は強力

重なる窓を使ったデータの処理は、「データを扱うテクニック」といった感じです。 窓に意味がなく、作った値がわかりにくいです。

ところが、重ならない窓は、窓に意味を持たせることができ、わかりやすいです。

また、重ならない窓は、他の特徴量との紐付けがしやすいです。 例えば、「毎月の売上高」と「毎月の平均気温」と紐付けて分析できるようになります。 「工場の生産周期」が窓でしたら、製品の検査データや、人の動作などと紐付けられるようになります。

ありふれた統計量を、重ならない窓で新しい使い道へ

データセット全体についての、平均値、標準偏差、最大値、最小値、相関係数などの統計量は、 一般的な統計ソフトでは簡単にできるようになっています。 しかし、できることや、わかることは限られています。

しかし、ひと手間加えて、重ならない窓ごとに、これらの統計量を計算すると、できることや、わかることの幅が広がります。

ありふれた統計量のこうした使い道は、重なる窓では「移動平均」などとしてよく知られています。 重ならない窓の場合は、重ならない窓の利点がありますので、また違った使い道になります。



順路 次は 0-1データの時系列解析

Tweet データサイエンス教室