統計学には、点推定と 区間推定 があります。
点推定をできるだけ精度良く、特に、実務の中で使う時に、困らないような形で求める理論が、ロバスト推定です。
このページは、主に、調べた本のメモとして作っています。
ロバスト推定は、「正規分布ではない分布で、代表値はどのように計算したら良いのか?」や、 「少数のサンプルから、母数を求めるには、何かが一番良いのか?」という研究が進められています。 比較的古い文献では、このような目的の話題が書かれています。
比較的新しい文献では、 機械学習 を実務で使うことを念頭においた話題が書かれていることが多いです。
外れ値の影響を受けにくい回帰分析の話が多いです。例えば、 サポートベクター回帰分析 があります。
「数理統計学 基礎から学ぶデータ解析」 鈴木武・山田作太郎 著 内田老鶴圃 1996
サンプル数が少ないt分布やコーシー分布のように、裾野が長い分布では、メジアンが、母数の推定量として、平均値よりも良いそうです。
トリム平均値も、メジアンほどではないものの、ロバスト推定として使われることも紹介しています。
「数理統計学の考え方 推測理論の基礎」 竹内啓 著 岩波書店 2016
コーシー分布の場合、トリム平均値が、良い推定量になることを紹介しています。
ロバスト推定の研究の歴史について、著者の見解があります。正規分布から外れた時の、ロバスト推定を議論するよりも、正規分布を仮定することの良さを挙げています。
順路 次は 大標本理論