Excelによるデータ分析

ExcelでMAレスSARIMAXモデル

このページでは、 MAレスSARIMAXモデル をExcelで実施する手順を説明します。

モデルの係数は、分析ツールにある重回帰分析で簡単に求められます。

予測値は、 TREND関数 で簡単に求まります。

以下では、下のデータを分析します。 グラフは1月から4月ですが、12月までの売上データを分析します。

水曜日は売上が高めで、土日が低めです。 そのため、7日の周期を持っていることが事前にわかっています。

また、祝日は、平日だとしても、土日と同じくらいになります。 4月と10月に、3日間ずつセールをしていて、その時は非常に高くなります。
ExcelでMAレスSARIMAXモデル

ExcelでMAレスSARIMAXモデル

テーブルデータの準備

まず、データを用意します。
ExcelでMAレスSARIMAXモデル

Iモデルにしたい場合は、下記のARやSの部分を作る前に、元のデータの差分データを作ります。 その差分データについて、ARやSの作業をすれば、Iモデルを作ったことになります。

この例ではIモデルは使いませんが、もしも差分データを作るのなら、以下のようになります。
ExcelでMAレスSARIMAXモデル

ARモデルの部分については、元のデータを、1行ずらしたデータを作って、新しい変数にします。 必要に応じて、2行や3行ずらした変数も作ります。
ExcelでMAレスSARIMAXモデル

Sモデルの部分については、元のデータを、1周期分ずらしたデータを作って、新しい変数にします。 例えば、ここでは周期が7日なので、7日分ずらしたデータの変数を作ります。
ExcelでMAレスSARIMAXモデル

Xモデルの部分については、上記までで作ったテーブルデータの各行について、その時点での外生変数の値を充てて、新しい変数とします。 外生変数は、複数あれば、それらをそのまま複数の変数として扱います。

土日祝日だけ1にした変数と、セールの日だけ1にした変数を足します。
ExcelでMAレスSARIMAXモデル

できたデータは、最初の7行の、1/1から1/7までは、欠損値があります。

欠損値がある行は、分析で使えないので、削除します。 なお、今回は削除しますが、 外れ値や欠損値のあるデータの解析 のページにあるように、どんな場合でも削除するとは限らないです。
ExcelでMAレスSARIMAXモデル

モデルの分析

「データ」タブの、「データ分析」を選びます。
ExcelでMAレスSARIMAXモデル

「回帰分析」を選びます。
ExcelでMAレスSARIMAXモデル

データの範囲を入力します。 Yが元データで、Xが新しく作った変数です。 ラベルにもチェックを入れます。
ExcelでMAレスSARIMAXモデル

分析データが新しくできたシートに記入されます。

まず、重決定R2(相関係数Rの二乗:寄与率)が0.79…なので、高い精度があることがわかります。

精度については、標準誤差からもわかります。 予測区間 は、標準誤差の±約2倍の範囲が95%の予測区間になります。 標準誤差が約7000(6892…)となので、予測値を中心として、上下に約14000円ずつばらつきがあります。 そのため、これは、例えば、「予測値が50000円の場合、実際は36000円〜64000円にある可能性はあるが、その範囲より外は可能性が低い」ということがわかります。

変数が4つありますが、売上(前日)は、係数が小さく、P値が比較的大きいことから、無視しても良いようです。 当初の見立ての通り、それ以外の3つが支配的と考えて良さそうです。
ExcelでMAレスSARIMAXモデル

予測

12/31までのデータがあるので、次の年の1/1のデータを予測します。 1/1の予測をするには、説明変数のセルを埋めます。 1/1は、祝日なので、祝日の変数は1です。 また、セールはしないので、セールの変数は0です。

TREND関数で重回帰分析による予測ができます。
ExcelでMAレスSARIMAXモデル

これで1/1の予測値が求まりました。 1/1の予測をする時に、前日の予測値を使いましたが、 1/2以降についても同様です。

TREND関数では、中心値が求まります。 予測区間は、中心値から上下に約14000円の範囲です。



Excelによるデータ分析


杉原データサイエンス事務所のロゴ
杉原データサイエンス事務所によるコンサルティングとセミナー