推定 のページには、正規分布の場合の信頼区間と予測区間の話があります。 これと同じように、 回帰分析 にも信頼区間と予測区間は出せます。
筆者の経験の範囲になりますが、実務で役に立ったことがあるのは予測区間の方だけなので、 ここでは予測区間に絞っています。
予測区間を使うと、「予測値がどのくらいの範囲になりそう」という分析ができるので便利です。
例えば、下図でしたら、「Xを10にすると、Yは15〜25になる」という予測ができます。
こうすると、「Yが25になることがあり得るのなら、Xを10にするのはやめておこう。」と言った
意思決定
ができるようになります。
データがたくさんある所、少ない所、ない所では、予測区間の精度が違うことを考慮したい時があります。
こうした場合には、 ガウス過程回帰分析 があります。
Rの実施例は、 Rによる予測区間の分析 のページにあります。
R-EDA1 でもできます。
「Similarity_of_Variables_and_Categories(変数やカテゴリの類似性)」
→「Between_label_column_and_others(ラベルのと他の変数の関係)」
→「Stratifeid_graph()
と進んだ中にある「scatter(散布図)」で予測区間を出すようにしました。
ただし、グラフを層別した時には、計算されません。
散布図は、グラフに赤い線で表示されます。
順路 次は 回帰分析への測定誤差の影響