トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

比例分布

proportional regression
比例分布は、上のグラフのような分布です。 Xが大きければ大きいほど、Y方向のばらつきが大きくなっています。

規模が大きければ大きいほど、ばらつきが大きい場合、このような分布になることがあります。 測定器のデータでも、このような分布になることがあります。

一般的に「比例」と言えば、Xが大きければ大きいほどYが大きくなる関係で、
Y = a * X
という式で表せます。

「比例分布」は、XとYが比例しているだけではなく、Y方向のばらつきもXに比例しています。

なお、「比例分布」というのは、筆者が付けた名前です。 世の中に名前がないようなので、付けたのですが、あればそちらに合わせるつもりです。

比例分布を表す式

proportional regression
比例分布は、上のような式で表されます。 aが傾き、Eというのは、ばらつきです。 EとXがかけ合わさることで、Xが大きければ、Y方向のばらつきが大きくなることが表現されます。

proportional regression proportional regression proportional regression proportional regression
ここでは、Eは一定にしています。aによって、見た目はだいぶ変わります。

Eの分布は任意

比例分布は、比例していることに注目した分類なので、Eの分布に特定の形はありません。 実務で多いのは、正規分布で、次が一様分布かと思います。

比例分布の意味

「比例分布とは何か?」という点を考察してみました。

統計学的な意味

proportional regression
比例分布は、両辺をXで割ると、上記のようになります。

この式の意味は、Y/Xという変数は、中心がaで、ばらつきがEということを表します。

例えば、「Y/Xが正規分布になっている」ということと、この意味は同じです。 統計学で、確率分布と呼ばれているものは、例えば、「Zが正規分布になっている」という見方をしますが、 比例分布の場合は、Zの部分が、Y/Xという2つの変数でできています。

下の2つの例は、いずれも右側がY/Xという変数のヒストグラムです。 比例分布を変形すると、正規分布や一様分布になる様子がわかります。
proportional regression

proportional regression

測定の観点での意味

一般的なねじは、基本は1mm単位で長さや直径が違います。 そのため、ねじがきちんと作られているかは、用途にもよりますが、0.1mm以下の誤差で管理する必要があります。

50m走のコースを作る時には、学校の体力測定のような用途なら、1m以下の誤差ならOKとするのが一般的ではないかと思います。

このように、一般的には、基準とする値が大きくなると、許容されるばらつきも大きくなります。 比例分布は、そのような性質を表す数理としても使えるようです。

物理的な意味

大きな物を動かすには、大きなエネルギーが必要になります。 大きな物を動かすと、慣性力も大きいので、位置決めがしにくくなります。

このような性質を表す数理としても、比例分布は使えるようです。

実際、 比例分布への品質工学のアプローチ にあるように、品質の分野では比例分布はよく出て来るので、昔から扱い方が研究されています。

比例分布のシミュレーション

比例分布のEは、任意の分布が使えます。

Eが正規分布の場合

このページのグラフは、EXCELの下記の関数で作っています。 aは傾き、Eは標準偏差です。 a、E、Xのところに値を入れると、Yが求まります。
=NORMINV(RAND(),a * X, E * X)
または
= X * NORMINV(RAND(),a, E)

Eが一様分布の場合

一様分布の場合、Eはばらつきの範囲(最大値と最小値の差)になります。
= X * (a + E * RAND())

比例分布のデータサイエンス

比例分布は、応用がいくつかあります。

比例分布と乗法モデル

比例分布と 乗法モデル は似ているものの、「違う」と考えた方が実用的です。


順路 次は 統計量

Tweet データサイエンス教室