トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

ラフ集合分析

ラフ集合分析は、物事をラフに理解するための方法です。 「特徴を見つける方法」とも言えます。

データ全体を眺めるための方法ではなく、部分を抜き出す方法なので、 データマイニング の一種です。

「ラフ集合」という集合の話と、ラフ集合を見つけるための計算方法は、一対一の関係ではないです。 ラフ集合を見つけるための計算方法は、 デザイン や企画のための手法として、 感性工学 の分野で精力的に研究されています。 このページでは、感性工学の分野で使われている計算方法を、「ラフ集合分析」と呼んで、まとめることにしています。

ラフ集合

上近似 下近似

ラフ集合のYは、「合格」「不合格」のような、質的データです。 ここでは、Xを質的データとして説明しますが、応用として量的データも使えます。

例えば、Xの変数として、A、B、C、D、E、Fの5つがあって、それぞれに「1」と「2」という、 2つのカテゴリーがあるとします。

Yが「合格」の中に、「A=1、B=2」が、必ず含まれているのなら、 「合格」の下近似は、「A=1、B=2」になります。

「合格」の中に、「A=1、B=2、C=1」が、必ずではないけれども、含まれていることが多いのでしたら、 「合格」の上近似は、「A=1、B=2、C=1」になります。

下近似や上近似になるXの水準の組合せは、ひとつとは限りません。 複数見つかるので、「複数の成功パターンを見つける」、といったことに使えます。

ラフ集合分析

扱うデータの種類

上記で、「Xは量的データでも使える」、と書きましたが、ラフ集合分析では、 「あり」と「なし」や、「暑い」と「寒い」のように、両極端の概念を、0から1の間の連続量で表しているデータを対象にしています。 このようなデータとして、 SD法 のデータがあります。 ラフ集合分析は、 アンケート の分析に適しています。

下近似の見つけ方

下近似は、「データから、確実に言えること」なので、使われることが多いようです。 以下は、下近似の見つけ方ですが、上近似の場合も大きくは変わりません。

ラフ集合分析の面白いところは、それぞれのYに対して、下近似が独立して求まるところです。 例えば、Yが合格の下近似が「A=1、B=2」の時に、 不合格の下近似が「A=2、B=1」と言う風に、逆が求まるとは限りません。

Xが量的データの場合、2.の段階の「異なっている」というのは、差の大きさで判断します。

他の手法との関係

ラフ集合分析に似た分析方法があります。 アソシエーション分析との関係については、 アソシエーション分析 のページに書きました。

決定木

決定木 でも、ラフ集合(下近似や上近似)の一部が見つかります。

決定木の場合は、「木」の形にモデルを作るため、ラフ集合のすべてを網羅できないようです。 しかし、サンプル数が多い時のラフ集合分析では、計算が莫大になるため、 その弱点を補う方法のひとつとして、使えるかもしれません。 決定木は網羅的ではないかもしれませんが、主要なものは見つかると思います。

判別分析

判別分析 でも、それぞれのYと関係の深いXが見つかります。 判別式のモデルで、Yの領域を表現できるのなら、判別分析が役に立ちます。

ラフ集合分析を使うと、部分的な交互作用が絡み合っているようなモデルを扱えます。 人間の感性のようなデータには、ラフ集合分析が適しているようです。




手法の使い分け

参考文献

人の考え方に最も近いデータ解析法 ラフ集合が意思決定を支援する」 森典彦・森田小百合 著 海文堂 2013
私たちは、「要するにこういうこと」、という風に物事を理解することがあります。 そのように理解するためのプロセスが、ラフ集合で説明できるため、「人の考え方に最も近いデータ解析法」というタイトルになっています。
扱っている事例は、車のデザインのような感性工学関係のものだけでなく、成績が伸びない子供の分析や、 市街地の活性化( まちづくり )の話題もあります。
デザインの指針としては、分析によって特徴を見つけ、特徴に合わせたデザインをしたとしても、 結局は誰の好みにも合わないものになりかねない。 あいまいな部分に新規性を探る余地があるそうです。
データのサンプルが多い場合の前処理として、 クラスター分析数量化V類 による、サンプルのグループ化を紹介しています。 属性値は、グループの平均値を使います。
連鎖構造についての、コメントが示唆に富んでいました。
・抽出したルールの和集合は、連鎖構造を持つ。
・人の好みは、連鎖構造を持つから、 アンケート で、ひとつの好みを選ばせるのは、無理を強いている評価になる。
・ひとつの言葉には、多様な意味がある。 意味は、その言葉の使われ方で決まる。 つまり、言葉も連鎖構造を持っている。
・グループ全体に共通した概念がなくても、個々の具体的な意味が連鎖的につながっていれば、 全体としてまとまった意味を持つ。 このような形で会社の デザイン のイメージを作っているなら、高度なデザイン管理をしていると言える。


ソフトコンピューティングのロジック 「人間の立場」で情報を扱う情報処理技術」 赤間世紀・宮本定明 著 工学社 2008
論理を扱う手法を紹介している本です。 (記号論理学の書き方なので、筆者には難解でした。) 古典的な2値の論理から始まって、あいまいな情報を記述するためのロジックとして、 ファジィ理論、 荒い情報を記述するためのロジックとして、ラフ集合が紹介されています。


「ラフ集合理論」入門 “粗い情報”の理論と推論への応用」 赤間世紀 著 工学社 2019
2冊に分かれています。
この本も 記号論理学 の書き方です。


感性工学

ラフ集合と感性 データからの知識獲得と推論」 森典彦・田中英夫・井上勝雄 編 海文堂 2004
ラフ集合は、ラフに記述して特徴をつかむための方法、としています。 計算が詳しい本です。


数理的感性工学の基礎:感性商品開発へのアプローチ」 長沢伸也 ・神田太樹 編 海文堂 2010
感性を分析する方法のひとつとして、ラフ集合が簡単に紹介されています。 ラフ集合は、縮約によって、行列形式の水準データの特徴を得る。


商品開発と感性」 長町三生 編 海文堂 2005
9章がラフ集合で、感性のあいまい性と、非線形性を扱う手法とされていました。


ラフ集合の感性工学への応用」 井上勝雄 編 海文堂 2009
デザインの企画、システム開発等への、応用の事例集です。




順路 次は Q分析

Tweet データサイエンス教室