Data Analysis by R

Rによるデータ分析


Rを使ってデータ分析をするためのレシピ集です。

Rによるデータ分析について

環境と品質のためのデータサイエンス
Pythonによるデータ分析


探索的データ分析

Rによるデータ全体の可視化 : 変数別の折れ線グラフ、ヒートマップ

Rによる変数の類似度の分析 : 総当たりの散布図、(相関係数、グラフィカルラスー、連関係数)×ネットワークグラフ、主成分分析×多次元尺度構成法、対数線形分析

Rによる隠れ変数の分析 : 主成分分析、独立成分分析

Rによるサンプルの類似度の分析 : (多次元尺度構成法・t-SNE・自己組織化マップ)×クラスター分析

Rによる個々のカテゴリの類似度の分析 : コレスポンデンス分析×多次元尺度構成法、アソシエーション分析×ネットワークグラフ

Rによる行と列の項目の、項目同士の類似度の分析 : 2部グラフ、コレスポンデンス分析×多次元尺度構成法×同時付置図

検証的データ分析

Rによる違いの有無の分析 : 層別の1次元分布のグラフ、平均値の差の検定、ばらつきの違いの検定、比率の差の検定、独立性の検定

異常のデータ分析

Rによる異常の定量化の分析 : MT法、(主成分分析、カーネル主成分分析)×MT法、LOF、最小距離法、多次元尺度構成法


Rでグラフを描く

ggplot2

簡単な道案内

1.データの利用法を見つけたい場合
(1)探索的データ分析で、着目するヒントを見つけ、仮説を立てる。
(2)検証的データ分析で、仮説の部分だけのグラフを作ったり、統計的に定量化したりして、仮説の真偽を判断

2.原因分析をしたい場合(目的変数が量的変数)
(1)データ全体の可視化変数の類似度の分析隠れ変数の分析 で、目的変数と各変数の関係を見る。 説明変数に質的変数がある場合は、 個々のカテゴリの類似度の分析 も有効
(2) 気になるところのデータだけを切り出して、散布図にする

3.原因分析をしたい場合(目的変数が質的変数)
(1) データ全体の可視化変数の類似度の分析隠れ変数の分析個々のカテゴリの類似度の分析 で、目的変数のカテゴリと、各変数のカテゴリの関係を見る。
(2) 気になるところのデータだけを切り出して、 違いの有無の分析