Rを使ってデータ分析をするためのレシピ集です。
Rによるデータ分析について
環境と品質のためのデータサイエンス
R-EDA1によるデータ分析
Pythonによるデータ分析
Excelによるデータ分析
ウェブアプリR-EDA1
ウェブアプリR-QCA1
ENGLISH
データ全体の可視化 :変数別の折れ線グラフ 、ヒートマップ
全変数間の類似度(量的) :相関係数分析 、グラフィカルラッソ 、偏相関係数による有向相関分析 、有向相関偏相関分析 、正規化による有向相関分析 、有向比例分散分析 、相関偏相関散布図 、LiNGAM 、主成分分析の基本 、変数の類似度の主成分分析 、カーネル主成分分析 、しきい値主成分分析 、因子分析 、項目反応理論 、正準相関分析 、分解分析
全変数間の類似度(質的) :ベイジアンネットワーク 、連関係数分析 、連関係数を使った主成分分析 、相互情報量 、相互情報量係数分析 、対数尤度情報量分析 、有向情報量分析 、累積寄与率連関係数 、質的変数の対数線形分析
1対多で変数の類似度(量的) : 変数の選択 、主成分回帰分析 、個別の因子の寄与率 、一般化線形混合モデル 、区間高次元化回帰分析 、ベクトル量子化回帰分析 、スプライン 、モデル木 、部分的最小二乗回帰分析
1対多で変数の類似度(質的) :MT法 、混合分布MT法 、異常の近傍法分析 、ロジスティック回帰分析 、多項ロジスティック回帰分析 、ベクトル量子化ロジスティック回帰分析 、ベクトル量子化平均法
1対多で変数の類似度(両方) :1対多のグラフ 、決定木 、N進木 、ランダムフォレスト 、隠れ変数の分析 、個々のサンプルの因果推論
カテゴリの類似度 :アソシエーション分析 、質的変数のコレスポンデンス分析 、個々のカテゴリの相関分析 、質的変数の主成分分析 、カテゴリの分解分析
サンプルの類似度(次元圧縮)
高次元データのネットワーク分析
、高次元を2次元に圧縮して可視化
、回帰分析系で高次元を2次元に圧縮して可視化
、サンプルの類似度の主成分分析
サンプルの類似度(クラスタリング) :クラスタリング 、クラスタリングの原因分析 、クラスターの予測 、次元削減クラスタリング分析
サンプルの類似度(外れ値探索) :外れたサンプルの探索
A-A型の分析 :距離行列の位置分析 、距離行列からの主成分分析 、距離行列のネットワーク分析 、ネットワークグラフ(非距離行列の分析) 、固有値分析 、無向グラフの固有値分析 、有向グラフの固有値分析 、可到達行列
A-B型の分析
:クロス集計
、クロス集計表の散布図分析
、2部グラフ
、分割表のコレスポンデンス分析
、クロス集計表の3部グラフ
、クロス集計表の回帰分析
、行列の分解
、クロス集計表の主成分分析
テキストデータ :テキストマイニング
時系列データ :準周期データの分析 、周期性のあるデータの分析 、時系列データの次元削減分析
検定 :違いの有無の分析 、正規性の分析 、対応のない2標本の類似度分析
推定 :予測区間の分析 、反実仮想因果効果分析
標準グラフ機能 、 ggplot2 、 Plotly 、 パレート図
ダミー変換 、2進数変換 、1次元クラスタリング 、サンプルデータ 、欠損値の前処理 、内積とカーネル