Data Analysis by R

Rによるデータ分析


Rを使ってデータ分析をするためのレシピ集です。

Rによるデータ分析について

環境と品質のためのデータサイエンス
Pythonによるデータ分析
Excelによるデータ分析

ウェブアプリR-EDA1
ウェブアプリR-QCA1

ENGLISH


データサイエンス教室

探索的データ分析

データ全体の可視化

データ全体の可視化 : 変数別の折れ線グラフ、ヒートマップ、拡大できる折れ線グラフ

変数の類似度

変数の類似度の分析 : 総当たりの散布図、(相関係数、グラフィカルラスー、LiNGAM、連関係数)×ネットワークグラフ、主成分分析×多次元尺度構成法、対数線形分析

隠れ変数の分析 : 主成分分析、独立成分分析、因子分析

異常の定量化の分析 : MT法、(主成分分析、カーネル主成分分析)×MT法、LOF、最小距離法、多次元尺度構成法

個々のカテゴリの類似度

個々のカテゴリの類似度の分析 : コレスポンデンス分析×多次元尺度構成法、アソシエーション分析×ネットワークグラフ

サンプルの類似度

サンプルの類似度の分析 : (多次元尺度構成法・t-SNE・自己組織化マップ)×クラスター分析

行と列の項目の、項目同士の類似度

行と列の項目の、項目同士の類似度の分析 : 2部グラフ、コレスポンデンス分析×多次元尺度構成法×同時付置図

テキストデータ

テキストマイニング

時系列データ

準周期データの分析 : 2次データへの変換

周期性のあるデータの分析 : fft、自己相関、相互相関、差分

時系列データの次元削減分析 :(主成分分析、独立成分分析、因子分析)×折れ線グラフ

検証的データ分析

違いの有無の分析 : 層別の1次元分布のグラフ、平均値の差の検定、ばらつきの違いの検定、比率の差の検定、独立性の検定

正規性の分析 : シャピロ・ウィルク検定

予測区間の分析

管理図 : 管理図、工程能力

ゲージR&R

手法を深く使う分析

主成分回帰分析 : 主成分回帰分析、因子分析

決定木 : 二進木、N進木、ランダムフォレスト

クラスター分析 : 階層型、非階層型(k-means法、X-means法、混合分布法、DBSCAN)

多次元尺度構成法 : 多次元尺度構成法、ネットワーク式の多次元尺度構成法

一般化線形混合モデル : 一般化線形モデル、線形混合モデル

対数線形分析 : 対数線形分析

主成分分析 : 主成分分析、主成分分析×多次元尺度構成法、質的変数の主成分分析

コレスポンデンス分析 : コレスポンデンス分析、多重対応分析

因子分析 : 因子分析

Rでグラフを描く

標準グラフ機能

ggplot2

Plotly

ネットワークグラフ

データの前処理

変数の変換 : ダミー変換、1次元クラスタリング

クロス集計