量的データを質的にデータにしたり、その逆の変換を知っていると、データ分析でできることが増えます。
ダミー変換 をRで実行する時の実施例です。
Rによるデータ分析 では、 質的データを量的データに変換 するための標準的な前処理の方法として、入れていることが多いです。
この例では、Cドライブの「Rtest」というフォルダに、 「Data.csv」という名前でデータが入っている事を想定しています。 このコードの前に、ライブラリ「dummies」のインストールが必要です。
データは、質的データと量的データが混ざったものです。
setwd("C:/Rtest") # 作業用ディレクトリを変更
library(fastDummies)# ライブラリを読み込み
Data <- read.csv("Data.csv", header=T) # データを読み込み
Data_dmy <- dummy_cols(Data,remove_first_dummy = FALSE,remove_selected_columns = TRUE)# ダミー変換
write.csv(Data_dmy, file = "Output.csv") # データをcsvファイルに出力
かわみのblog
上記で使っているパッケージ以外も含む、ダミー変数を作ることができる4つのパッケージを紹介しています。
https://fuminorikawami.hatenablog.com/entry/2018/10/27/170129