トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

アソシエーション分析

データマイニング の事例として、ビールとオムツの話は有名です。 アソシエーション分析は、この事例のような分析ができる手法です。

「アソシエーション・ルール」、「連関規則」、「マーケット・バスケット分析」とも呼ばれています。
Decision Tree Decision Tree

指標

確信度は、XとYを入れ替えて計算すると、違う値なので、2つの変数に対して非対称です。 矢印のついたネットワークグラフを描くことができます。

支持度は、2つの変数に対して対称的です。

ラフ集合分析との関係

ラフ集合分析 には独自のアルゴリズムで、ラフ集合を見つける方法が紹介されています。

アソシエーション分析のアルゴリズムは、 ラフ集合分析 にも使えます。

ソフト

Rによる実施例は、 Rによる個々のカテゴリの類似度の分析 にあります。




if-thenルールと因果関係の関係

手法の使い分け


参考文献

データマイニング入門 :Rで学ぶ最新データ解析」 豊田秀樹 編著 東京図書 2008
入力データが、「@ 質的データのそれぞれが、変数になっていて、「あり・なし」が1と0で表されている形式」と、 「A 表形式になっていて、質的変数として、質的データが入っている形式」 の2種類について、Rの実施例があります。 この本では、@とAの違いは、matrixにする行を入れるかどうかの違いだけです。 このサイトの実施例では、量的データが混ざっている場合に、質的データに変換してから使うコードを入れたこともあり、、 @とAのどちらでも大丈夫です。@の時は、何の心配もいらないのですが、Aの時は量的データの1行目が整数だと、 その列はダミー変換がされません。読み込むファイルの1行目は、25.0等の小数点を含むデータにしてください。
パラメータの設定の仕方も詳しいです。


同志社大学 金明哲先生のページ
入力データが、「各サンプルが質的データのセットになっている形式」になっている場合が、Rの実施例になっています。
https://www.cis.doshisha.ac.jp/mjin/R/40/40.html


フリーソフトではじめる機械学習入門」 荒木雅弘 著 森北出版 2014
アソシエーション分析では、計算する組み合わせが膨大になるため、 優先度の高い組み合わせだけが計算されるようになっています。 そのアルゴリズムは、アプリオリアルゴリズムや、FP-Growthアルゴリズムと呼ばれるものですが、これらのアルゴリズムを図解しています。


Albert社のページ
各指標が、図解されていてわかりやすいです。リフトが1より小さい時は、おすすめしないようにするそうです。
https://www.albert2005.co.jp/knowledge/marketing/customer_product_analysis/abc_association



順路 次は 個々のカテゴリの相関分析

Tweet データサイエンス教室