トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

過学習

過学習は、「過剰に学習している」という意味です。 「オーバーフィッティング」とも呼ばれています。 データにぴったり合わせるために、モデルを複雑にする事が裏目に出ています。

例えば、たくさんの項を入れた長い式のモデルを作ると、こういった事がおきます。

交差検証法

過学習しているかもしれないモデルを使うのは危険なので、モデルの検証方法が考えられています。 交差検証法と言います。

データを2つに分け、片方でモデルを作って、残りを作ったモデルに入力して、予測の精度を検証する方法が簡単です。

ちなみに、この方法は、寄与率やAICによるモデルの妥当性の検証とは異なります。 寄与率やAICは、モデルを作成する時に使ったデータに対しての、モデルの妥当性の評価に使われます。





順路 次は 外挿

Tweet データサイエンス教室