決定木 は、目的変数Yの種類で大きく2種類に分かれます。 質的データの場合は「分類木」、量的データの場合は「回帰木」と呼ばれます。
回帰木には、名前からわかるように 回帰分析 と同じように、任意のXを入力した時に、Yの数値を 予測 する使い方ができます。
ただ、回帰木では、基本的にXは質的データとして扱われているので、数値の精度はあまり良くありません。 数値の精度を良くしようとすると、 今度は、 過学習 になって、わけのわからない複雑なモデルになりがちです。
回帰木の使い道は、 予測 よりも 因果推論 や データマイニング の方が現実的と思います。 回帰分析 というよりも、無数の 分散分析 をするイメージです。 Yを適度にグルーピングして分析するツールとして役立ちます。
回帰木には、2進木はありますが、 N進木 はないようです。
N進木 の良さを使いたい場合は、Yを 1次元クラスタリング で質的データに変換し、分類木として分析する方法があります。
モデル木 は回帰木の一種ですが、Xを量的データとしても扱うので、過学習にならずに、数値の精度を上げられる方法になっています。
Rの実施例が、 Rによる決定木 のページにあります。
順路 次は N進木