トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

層別のグラフ

層別のグラフというのは、そういう名前のグラフがあるのではなく、グラフの作り方のひとつです。

左が層別なしのグラフで、右が層別ありのグラフです。 使っている数値のデータは同じですが、 右は、A1〜5という名前で、 箱ひげ図 を別々に作っています。
箱ひげ図 箱ひげ図

このページの例は箱ひげ図ですが、 層別 するグラフは、どんなグラフでも作れます。

層別のグラフを作ると、グラフを使って、比較ができるようになります。 「分ければ分かる」と言われますが、まさにその作業になります。 簡単なひと手間ですが、 グラフ統計 でできることが広がります。

組み合わせが多過ぎて、どのように層別したら良いのかがわからない時は、 決定木 がヒント作りに役立ちます。

層別のグラフを作るためのデータ

データの形 データの形

データの形を2つ挙げてみました。ソフトにもよりますが、このページのように、1つの因子で分割している層別のグラフなら、どちらの形でも作れます。

ただ、因子を複数にして、グラフの分割をさらに進めたい場合は、右側の形式にしておく必要があります。 右側の形式にしておくと、項目の追加ができます。
データの形

ソフト

層別の方法として色分けのできるソフトはいろいろありますが、 簡単にグラフの枠を分けたグラフを作ることができるソフトは限られて来ます。

RとPython

Rなら ggplot2 、 Pythonなら seaborn は、わりと簡単に枠の分割もできます。

R-EDA1

R-EDA1 では、簡単に2次データが作れるようになっています。 「One_variable(一変数)」の中の「Quasi_periodic(準周期)」は、 この機能は、グラフの出力はなく、分析のデータがダウンロードできるようになっています。
必要に応じて、このデータをさらに分析に使うことを想定しています。
準周期性が、1と0の数字で表されている変数があれば、それを使うことができます。 こういった変数がない場合、特定の変数について、「1列目が、40より大きければ1、40以下なら0」というようにして、こうした変数を作ることもできます。
R-EDA1  



順路 次は 棒グラフ

Tweet データサイエンス教室