トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

分類木と回帰木

決定木 は、目的変数Yの種類で大きく2種類に分かれます。 質的データの場合は「分類木」、量的データの場合は「回帰木」と呼ばれます。

回帰木の使い道

回帰木には、名前からわかるように 回帰分析 と同じように、任意のXを入力した時に、Yの数値を 予測 する使い方ができます。

ただ、回帰木では、基本的にXは質的データとして扱われているので、数値の精度はあまり良くありません。 数値の精度を良くしようとすると、 今度は、 過学習 になって、わけのわからない複雑なモデルになりがちです。

回帰木の使い道は、 予測 よりも 因果推論データマイニング の方が現実的と思います。 回帰分析 というよりも、無数の 分散分析 をするイメージです。 Yを適度にグルーピングして分析するツールとして役立ちます。

回帰木のN進木

回帰木には、2進木はありますが、 N進木 はないようです。

N進木 の良さを使いたい場合は、Yを 1次元クラスタリング で質的データに変換し、分類木として分析する方法があります。

モデル木

モデル木 は回帰木の一種ですが、Xを量的データとしても扱うので、過学習にならずに、数値の精度を上げられる方法になっています。

ソフト

Rの実施例が、 Rによる決定木 のページにあります。



順路 次は N進木

データサイエンス教室