杉原データサイエンス事務所のロゴ Rによるデータ分析

Rによる2つの質的変数の分析

効果量として 連関係数 、P値の計算に独立性の検定を計算し、グラフとして100%積み上げ縦棒を作ります。

変数の類似度の分析 です。

連関係数・独立性の検定・100%積み上げ縦棒

基本的に質的変数を扱う方法ですが、量的変数は 1次元クラスタリング の方法で、質的変数に変換するコードが入っているので、 質的・量的が混合していたり、量的変数だけでも使えるようにしてあります。

library(vcd) #ライブラリを読み込み
setwd("C:/Rtest")
# 作業用ディレクトリを変更
Data <- read.csv("Data.csv", header=T)
# データを読み込み
Data1 <- Data
# 1次元クラスタリングの出力先を作る
n <- ncol(Data1)
# データの列数を数える
for (i in 1:n) {
if (class(Data1[,i]) == "numeric") {
Data1[,i] <- droplevels(cut(Data1[,i], breaks = 3,include.lowest = TRUE))
# 3分割する場合。量的データは、質的データに変換する。
}
# if文の処理の終わり
}
# ループの終わり
cross<-xtabs(~Data1[,1]+Data1[,2],data=Data1)
# 1列目と2列目の変数の分割表を作成
res<-assocstats(cross)
# 連関分析
cramer_v<-res$cramer
# クラメールの連関係数の抽出
cramer_v

chisq.test(cross)
# カイ二乗検定(独立性の検定)

library(ggplot2)
ggplot(Data1, aes(x = Data1[,2], fill = Data1[,1])) +
geom_bar(position = "fill") +
scale_y_continuous(labels = scales::percent) +
labs(x = colnames(Data1)[2], y = "Ratio", fill = colnames(Data1)[1])

cramer



Rによるデータ分析


杉原データサイエンス事務所のロゴ
杉原データサイエンス事務所によるコンサルティングとセミナー