トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

情報理論

情報理論（Infomation Theory）は、情報の量を数学的に定義して扱う分野です。

「情報理論」がタイトルになっている本は、情報量の解説から始まって、通信の話に入っていくものが多いです。

しかし、統計学や機械学習の分野は情報の扱い方が重要ですので、これらの分野でも、情報量という量は使われています。

情報量

情報理論では、情報量を
情報量 = log ( 1/ 事象の起きる確率 )　
と定義します。

このようにすると、「起こりにくいと思っている事象ほど、情報の値は高い」という性質を表現できるようになります。

また、この表現は、統計学と情報理論の接点になっています。

平均情報量

情報量の平均（期待値）は、「平均情報量」と呼ばれています。

平均情報量には、質的変数のばらつきの尺度としての使い方があります。

最尤法と情報量基準

統計モデルの妥当性を評価する方法で、情報理論と統計学にまたがっている方法です。変数の選択の方法になります。

異なるモデルを比べるための指標が、情報量基準です。筆者の知っている情報量基準は AIC（Akaike's Information Criterion）のみですが、 BICやGICと言った量も考案されているようです。

最尤推定量とは、モデルのパラメータの値です。最尤推定量や情報量基準は、カルバック情報量（相対エントロピーとも言います）を最小化することによって求まります。

フィッシャー

情報理論では、フィッシャー情報行列という量が出てきます。フィッシャーという名前は、分布（F分布）でも、分散分析でも、実験計画法でも登場しますが、同一人物です。ずいぶんお世話になっていることを、当サイトを作っていて初めて知りました。

参考文献

「情報理論の基礎　情報と学習の直観的理解のために」村田昇　著　サイエンス社 2008
機械学習の中での情報理論を理解するための本です。
情報幾何学を紹介し、いろいろなアルゴリズムの幾何学的な説明もあります。サンプリングの本としても、参考になります。
EMアルゴリズム　：　データの欠損がある時に、その部分を補間して使う方法。

「情報の物理学」豊田正著講談社 1997
「情報が多い・少ない」ということを、どうやって量として定義するのかについて、身近な例を使ったわかりやすい解説があります。また、情報量基準（AIC）の導出があります。

「生のデータを料理する」岸野洋久著日本評論社 1999
親しみやすいタイトルですが、中身は難解です。実際の調査と理論の結び付きが、しっかりしています。

「情報系の数学入門」林晋・八杉満利子著オーム社 1993
集合や論理の本です。情報理論の本ではないですが、他に適当なページがなかったので、ここにメモしています。

「イラストで学ぶ情報理論の考え方」植松友彦　著　講談社　2012
情報量の性質を丁寧に解説しています。

順路次は情報統計力学