杉原データサイエンス事務所のロゴ R-EDA1によるデータ分析 | ウェブアプリR-EDA1

R-EDA1による重回帰分析

原因系が複数ある場合は、重回帰分析を使います。

「Excelによる統計的因果推論」の第6章の応用編にある分析について、R-EDA1による実施例です。

説明変数が3つまでの重回帰分析

普通の散布図で分析できるのは、原因系が1つの場合ですが、R-EDA1の散布図は、色や分割を使う事で、3つまでは分析できるようにしています。 この散布図と、重回帰分析を組み合わせた分析ができます。

原因系が2つの場合


上のデータを分析します。


結果は、上のようになります。 グラフ、因果効果(単位量の当たりの売上変化量)、P値が出力されます。

線形混合モデル


上のデータを分析します。


気温と売上の関係だけを見ると、気温が上がるほど売上が高そうですが、強い関係ではないように見えます。


自販機で色分けすると、それらの自販機については、気温と売上に相関があるように見えます。


自販機で分割した方が、関係が見やすくなることもあります。


「Using GLM」にチェックを入れます。


各自販機や、自販機と気温の交互作用のそれぞれについて、因果効果が出力されます。

説明変数が多い時の重回帰分析

重回帰分析
売上が目的変数で、説明変数の候補として、4つの変数がある場合です。 この程度なら、散布図の機能の中で、組み合わせをいろいろ変える分析でも良いですが、もっと多い時は大変になります。

このような時は、上記とは別の機能を使うと良いです。 目的変数の列番号だけを指定します。
重回帰分析

重回帰分析
組み合わせの取捨選択が自動的に進み、目的変数と関係なさそうな変数は除外されます。 最終的に残った変数が、意味のありそうな変数になります。

ここまで絞り込みを進めてから、散布図でデータの詳細を調べると、見逃しの少ない分析ができます。




杉原データサイエンス事務所のロゴ
杉原データサイエンス事務所によるコンサルティングとセミナー