R-EDA1によるデータ分析 |
ウェブアプリR-EDA1原因系が複数ある場合は、重回帰分析を使います。
「Excelによる統計的因果推論」の第6章の応用編にある分析について、R-EDA1による実施例です。
普通の散布図で分析できるのは、原因系が1つの場合ですが、R-EDA1の散布図は、色や分割を使う事で、3つまでは分析できるようにしています。 この散布図と、重回帰分析を組み合わせた分析ができます。
上のデータを分析します。
結果は、上のようになります。
グラフ、因果効果(単位量の当たりの売上変化量)、P値が出力されます。
上のデータを分析します。
気温と売上の関係だけを見ると、気温が上がるほど売上が高そうですが、強い関係ではないように見えます。
自販機で色分けすると、それらの自販機については、気温と売上に相関があるように見えます。
自販機で分割した方が、関係が見やすくなることもあります。
「Using GLM」にチェックを入れます。
各自販機や、自販機と気温の交互作用のそれぞれについて、因果効果が出力されます。
売上が目的変数で、説明変数の候補として、4つの変数がある場合です。
この程度なら、散布図の機能の中で、組み合わせをいろいろ変える分析でも良いですが、もっと多い時は大変になります。
このような時は、上記とは別の機能を使うと良いです。
目的変数の列番号だけを指定します。
組み合わせの取捨選択が自動的に進み、目的変数と関係なさそうな変数は除外されます。
最終的に残った変数が、意味のありそうな変数になります。
ここまで絞り込みを進めてから、散布図でデータの詳細を調べると、見逃しの少ない分析ができます。
