標準偏回帰係数

データを直接重回帰分析するのではなく、変数ごとに標準化してから重回帰分析した場合の偏回帰係数は、「標準偏回帰係数」と呼ばれます。

標準偏回帰係数の使い道

説明変数が、「身長と体重」など、単位が異なる場合、これらを使った重回帰分析のモデルでは、偏回帰係数の単位が異なります。そのため、偏回帰係数同士を比較することができません。

データを標準化しておくと、無次元になるため、偏回帰係数同士の比較ができるようになります。

説明変数同士が独立して考えることができるのなら、標準偏回帰係数の絶対値が大きな変数ほど、目的変数に影響の大きな変数と考えることができるようになります。

説明変数同士が独立しているのなら、標準偏回帰係数は、各変数と目的変数の相関係数です。この性質は、傾きと相関係数と標準化の話と、同じです。

また、標準偏回帰係数の２乗は、目的変数に対しての個別の因子の寄与率になっています。

個別の因子の寄与率のページにあるように、実際のデータでは「説明変数同士が独立している」ということは、あまりないのですが、「説明変数同士が独立している」に近い状況なら、この知識は役に立ちます。

Y、X1、X2という３個の変数について、「Y = A1 * X1 + A2 * X2 + B」という重回帰分析を考えます。

A1とA2が、偏回帰係数です。

A1を求める式は、以下になります。Sというのは、平方和です。この式の求め方の説明は、省略します。
標準偏回帰係数

標準化されていると、上記の式のSの部分を、S'に入れ替えるのですが、S'と相関係数rには、以下の関係があります。 tというのは、標準偏差です。
標準偏回帰係数

上記の平方和Sの部分が、相関係数rに置き換わります。
標準偏回帰係数

つまり、以下のようになります。標準偏回帰係数は、３つの相関係数でできています。