トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

回帰分析の予測区間

推定 のページには、正規分布の場合の信頼区間と予測区間の話があります。 これと同じように、 回帰分析 にも信頼区間と予測区間は出せます。

筆者の経験の範囲になりますが、実務で役に立ったことがあるのは予測区間の方だけなので、 ここでは予測区間に絞っています。

回帰分析の予測区間の使い道

予測区間を使うと、「予測値がどのくらいの範囲になりそう」という分析ができるので便利です。

例えば、下図でしたら、「Xを10にすると、Yは15〜25になる」という予測ができます。 こうすると、「Yが25になることがあり得るのなら、Xを10にするのはやめておこう。」と言った 意思決定 ができるようになります。
Y = A * X + B

ガウス過程回帰分析

データがたくさんある所、少ない所、ない所では、予測区間の精度が違うことを考慮したい時があります。

こうした場合には、 ガウス過程回帰分析 があります。

ソフト

R

Rの実施例は、 Rによる予測区間の分析 のページにあります。

R-EDA1

R-EDA1 でもできます。

「Similarity_of_Variables_and_Categories(変数やカテゴリの類似性)」
→「Between_label_column_and_others(ラベルのと他の変数の関係)」
→「Stratifeid_graph()
と進んだ中にある「scatter(散布図)」で予測区間を出すようにしました。 ただし、グラフを層別した時には、計算されません。

散布図は、グラフに赤い線で表示されます。
R-EDA1



順路 次は 回帰分析への測定誤差の影響

Tweet データサイエンス教室