トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

回帰分析

回帰分析は、Y(目的変数)とX(説明変数)の関係を、式で表現する方法です。 Yは量的変数を扱います。

回帰分析は、 多変量解析 の中で、もっとも使われている方法ではないかと思います。 また、もっともわかりやすいと思いますし、ここから始めると他の手法も理解しやすくなります。 時系列解析 等、応用も豊富です。

基本の知識

単回帰分析 は、 重回帰分析 の一番シンプルな形です。 Xがひとつしかない2変量の解析です。 勉強の順番としては、2変量の場合をしっかり押さえてからの方が、 重回帰分析 で失敗をしにくくなります。

単回帰分析

単回帰分析で最初に理解しておくと、重回帰分析をする時にも応用できる知識です。

重回帰分析

進んだ知識

単回帰分析

単回帰分析の進んだ知識は、重回帰分析の時にも応用できます。 ただ、重回帰分析に応用する使い方は、複雑になって来るので、関係者の理解を得ながら実務で使って行くのは難しい方法になって来ます。

重回帰分析

回帰分析の限界

「XとYの関係を表現したい。」、「XからYを予測したい。」、といった事は、何かの形でデータに関わっていれば、 誰しも思うところではないかと思います。 そして、回帰式のようなものを、自己流で考えることもあると思います。

そうしたところに、「最小二乗法で回帰式の係数を求める。」なんて話を聞くと、「これだ!」と思うのではないでしょうか? (筆者はそうでした。。。)

しかし、回帰分析は万能ではありません。 二次の項を入れたり、対数に変換したり、回帰分析の発展形を使ったり、といった工夫で解決することもありますが、 それらを使ってもうまくいかない事はたくさんあります。

回帰分析が得意なのは、静的な(時間に依存しないとみなせる)現象で、 YとXの 線形性 を解析する場合です。 動的な現象の解析は、 経時解析 (Yと時間の関係の解析)や、 自己相関分析 (現在のYと、過去のYの関係の解析)、 丁寧に 層別 した解析で、うまく行く時があります。

「XとYの関係を表現したい。」、「XからYを予測したい。」というニーズに対しては、 データマイニング 等の数理や、 メタ知識 を駆使していくことも大事です。 メタ知識としては、起きている現象の数理をあらかじめ考えておくことが有効です。 物理的な現象なら、例えば、「Yは、対数の形にしておいた方が良い」や、「Xは、逆数を使った方が良い」、 ということを検討しておいて、それをモデル式を作る時に活かします。



どのような手法(モデル)を実務で使いますか?

相関関係の探索

足し算モデルと割り算モデル


参考文献

ランク回帰と冗長性分析」 齊藤堯幸 著 森北出版 2002
縮小ランク回帰・合成変量による多変量回帰・計量心理学の冗長性分析を扱っている本です。 どうやら、 回帰分析 や、 主成分分析 の応用のようです。
これらの手法の事例が、植生と土壌の関係や、服の感触の解析や、臭気の調査なので、 このサイトの 農産物の貿易 や、 環境生理学 と関係していました。 手法の内容がわからないのですが、結論を見る限り、「この手法ならでは」という感じがしないです。 手法の威力がわからないでいます。


本質を捉えたデータ分析のための分析モデル入門 統計モデル、深層学習、強化学習等 用途・特徴から原理まで一気通貫!」 杉山聡 著 ソシム 2022
基本を線形回帰分析として、そこから広げた感じです。 画像や言語データのモデルが多めですが、それだけではなく、幅広く扱っています。



順路 次は 相関性と相関係数

Tweet データサイエンス教室