トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

言葉の散布図

通常の 散布図 でプロットがある場所に、言葉が書かれている散布図があります。 「言葉の散布図」と、ここでは呼ぶ事にします。
項目の散布図

主成分分析多次元尺度構成法自己組織化マップ多変量データの傾向解析では、解析結果は言葉の散布図でまとめると、とてもわかりやすいです。

そのデータをどうやって計算したのかが、手法によって違いますが、 言葉の散布図に使われているデータの形式は、どれも同じで、項目の質的データと、縦軸、横軸の2つの量的データがあります。 このページの例の散布図のデータは、 サンプルファイルになります。

言葉の散布図の威力

1次元で表している絵は、印象が弱い事があります。

3次元で表している絵は、一般的には、とてもわかりにくいです。 設計等のソフトでは、物は3次元の構造をしているので、3次元で表現できるようになっていますが、 回転させたりしなければいけないです。

パッと見て、一番わかりやすいグラフは、2次元の絵と思います。 実際、 多変量解析データマイニング の手法に、2次元の絵を解析結果にする手法が多いのは、これが理由と思います。

言葉の散布図の場合、 言葉の数が数百の規模を超えて来ると、文字が重なったりして、実用的でなくなって来ます。 しかし、この規模までなら、パッと見ただけでデータの全容を把握できます。

縦軸と横軸を何にするのかが、解析者の腕の見せ所です。

言葉の散布図を作ることができるソフト

Excelで作れると、筆者としては一番手軽なのですが、今のところ、できないようです。 筆者の身近なソフトで、言葉の散布図を作れるのは、Rだけのようです。

Rの場合は、手順を残しておくと、繰り返し作る時に楽なので、このページにまとめてみました。

Rの使用例

Rでは下記で作れます。 ただ、後でわかったのですが、 ggplot2 の方が簡単です。

前提条件

※ フォルダの場所や、ファイル名等は、一例です。
(1) パソコンに、Rをダウンロードして、インストールする。
(2) maptoolsをダウンロードして、Rのモジュールとして使えるようにしておく。
(3) Cドライブに「Rtest」というフォルダを作る。
(4) Rtestフォルダに、グラフにしたいデータを「MapData.csv」という名前で置く。
(5) Y軸は、-1から1を範囲にする。

Rの命令文

※ 下記の5行を、一度にコピーペーストして実行すると、エラーになる場合があります。  その場合は、1行ずつ進めればできました。

library("maptools")  # maptoolsを読み込み
setwd("C:/Rtest") # 作業用ディレクトリを変更
data <- read.csv('MapData.csv', header=T, sep=",") #データを読み込み
data.label<-data$Name #データから、項目名を読み込み
plot(data$X,data$Y,xlab="X",ylab="Y",type="n",ylim=c(-1,1)) #グラフの土台を作る
pointLabel(x=data$X,y=data$Y,labels=data.label) #土台に項目名を書き込む



ワードクラウド

順路 次は ネットワークグラフ

Tweet データサイエンス教室