Excelによるデータ分析

Excelによる残差の外れ値の分析

残差の外れ値 の分析は、 回帰分析 だけでなく、目的変数が量的データになっている教師あり学習の手法ならどれでもできますし、手法によって結果は違います。

RやPythonなどで残差を出そうとすると、標準的な出力になっていないので、ちょっとした手間がかかります。

一方、回帰分析に限った話になるのですが、回帰分析の残差を出すのなら、Excelで簡単にできます。
Excelによる残差の外れ値の分析

データの準備

データを準備します。

この例のデータは、サンプルが100個あり、説明変数がX1、X2の2つあります。
Excelによる残差の外れ値の分析

ツールの選択

「データ」にある「データ分析」を選びます。 (自分のExcelにない場合は、アドインの設定で追加できます、)
Excelによる残差の外れ値の分析

回帰分析と残差の出力

「回帰分析」を選びます。
Excelによる残差の外れ値の分析

情報を入力します。 ここでは、データの1行目にある変数名を範囲に含んでいるので、「ラベル」にチェックを入れています。 また、残差を出力したいので、「残差」もチェックしています。
Excelによる残差の外れ値の分析

回帰分析の結果の下の方に、「残差」が出力されています。
Excelによる残差の外れ値の分析

グラフにする

「挿入」の「ヒストグラム」を選びます。
Excelによる残差の外れ値の分析

グラフになりました。このデータの場合は、外れ値がある様子もわかります。
Excelによる残差の外れ値の分析

グラフにする

残差を計算する前の、予測値と実測値の散布図でも、外れ値のサンプルの外れ方がわかります。 ちなみに、この分析は、 回帰分析系で高次元を2次元に圧縮して可視化 の方法の実施例にもなります。
Excelによる残差の外れ値の分析



Excelによるデータ分析

データサイエンス教室