EDA(探索的データ分析)
として、上のような総当たりのグラフが使われることがあります。
上の例くらい問題ないのですが、 変数が多い総当たりのグラフは、ひとつひとつが小さく、ごちゃごちゃなグラフになって、分析が難しくなります。 変数がn個だと、総当たりのグラフの数は、n×n個になります。
しかし、そもそも因果関係の分析をする時などは、総当たりの散布図は必要なく、1つの変数と他のすべての変数の組み合わせについて、散布図を見たいことがあります。 つまり、見たいのは、総当たりの中の1列だけの時があります。
1つの変数と他のすべての変数の組み合わせに絞ると、グラフの数がかなり減って便利です。 変数がn個だと、グラフの数は、n-1個になります。
同じデータについて、1つの変数と、他のすべての変数の組み合わせだけで作ったグラフが下のグラフです。
上の例は、目的変数が質的変数です。
量的変数の場合は、下記のようになります。
Rによる1対多のグラフ のページがあります。
総当たりの散布図は、 標準グラフ機能 のページにあります。
Pythonによる1対多のグラフ のページがあります。
R-EDA1
でもできます。
順路 次は 1次元分布のグラフ