Excelによるデータ分析 | Rによるデータ全体の可視化 | Pythonによるデータ全体の可視化

Excelによるデータ全体の可視化

最近のExcelには、たくさんの変数を見るためのグラフが充実して来ています。

知りたいグラフへの近道

たくさんの量的変数のサンプル順の折れ線グラフ(スパークライン)
たくさんの量的変数の1次元分布の比較(箱ひげ図)
たくさんの量的変数を色で見る(ヒートマップ)

たくさんの量的変数のサンプル順の折れ線グラフ(スパークライン)

初めて扱うデータの場合、とりあえず 折れ線グラフ にして、見てみたいことがあります。 列が大量な時に便利なのが、Excelのスパークラインです。

まず、こんなデータがあったとします。
スパークラインを描く

1行目に新しい行を作ります。 行の高さも少し大きくしておきます。
スパークラインを描く

挿入のメニューから、スパークラインの折れ線を選びます。
スパークラインを描く

データの範囲と、グラフを作るセルを指定します。 A列のデータをグラフにするのでしたら、グラフを作るセルはA1にすると良いです。
スパークラインを描く

グラフが1個できました。
スパークラインを描く

あとは、A1セルをコピーして、B1、C1にペーストしていくだけです。 効率の良いコピーペーストのやり方は、割愛します。
スパークラインを描く

たくさんの量的変数の1次元分布の比較(箱ひげ図)

箱ひげ図 だけですが、たくさんの量的変数をいっぺんに見る方法として使うことができます。

まず、こんなデータがあったとします。
箱ひげ図

データの範囲を選びます。
箱ひげ図

挿入のメニューから、箱ひげ図を選びます。
箱ひげ図

ひとつの変数がひとつの箱になっている箱ひげ図ができました。 Y軸の範囲の調整等は、他のグラフと同じです。 書式設定を使うと、中央値の出し方を変えることもできます。
箱ひげ図

たくさんの量的変数を色で見る(ヒートマップ)

ヒートマップ 」という名前のグラフはないです。 しかし、 データを表の形で表示しているので、条件付き書式の「カラースケール」を組み合わせると、ヒートマップを作ることができます。

ヒートマップは、スパークラインとは違った見方で、Excelで大量のデータを見ることができます。

下の2つの表には、同じ数字が書かれているのですが、ヒートマップにした方は、値が極端に高いところが緑色、 低いところが赤色、中間が黄色になっています。
ヒートマップ ヒートマップ



Tweet データサイエンス教室