トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

2次元散布図

2次元散布図の使い道は、 関係のグラフ として使う場合と、 2次元分布を表すグラフとして使う場合があります。

1次元散布図 のページがあるため、 タイトルは、「2次元散布図」にしましたが、 一般的に「散布図」と言えば、2次元のものを言っていることが多いです。

強み

強みは、すべてのデータをプロットしますので、個々のデータの具体的な位置や値をチェックするのに向いていることです。
二次元散布図 色分け 正負の相関

外れ値が目立ちやすいので、 外れ値の判定 でも重宝します。

弱点

データがある程度以上に、密集してしまう領域については、 「密集している」ということがわかるだけで、密集の度合いがわからないことです。 そのため、データが多い時には、うまく使えないことがあります。

ヒートマップ を使った2次元の ヒストグラム や密度分布の方が良いことがあります。
下のグラフは、散布図、2次元ヒストグラム、密度分布の順です。
ジョイントプロットのデータ 6角形の2次元ヒストグラム 密度分布のデータ

RやPythonで描く

散布図は、Excelでも簡単に作れますが、 層別のグラフ は手間がかかります。 層別のグラフggplot2seaborn という グラフ統計のソフト があります。

Plotly だと、データの密集している部分を拡大する分析が簡単にできます。



順路 次は 言葉の散布図

Tweet データサイエンス教室