トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

お金のデータ

「お金」のデータと言えば、売上高、株、値段といった話が多いですが、ここではデータとしてのお金の性質を考えてみました。

頻度のデータとのアナロジー

お金は、計算上はマイナスの数字が表れることもありますが、0以上の整数しか基本的にありません。

また、お金の合計値には意味があります。

これらの性質は、統計学にある頻度のデータと同じになって来ますので、お金のデータを頻度のデータの理論で扱うのは、筋が良いと思います。 こうした理論としては、 クロス集計コレスポンデンス分析 があります。

「合計値に意味がある・ない」によるデータの区別

測定 のページのデータの分類の仕方は、よく知られているものです。 一方、合計値に意味があるかどうかで、データを区別することは一般的ではないです。

「温度」と「長さ」は、両方とも、「量的データ」、「連続データ」、「計量データ」という特徴があります。 「温度」について、「20℃+25℃=45℃」という合計は物理学的には間違いで、 合計値を計算しても意味がありません。 「長さ」の合計は、「長さ」として使われます。

脱線すると、温度は合計しませんが、温度と密接な関係がある「エネルギー」は合計することに意味がある量です。 データサイエンティストの技として、こういう性質を使う話を、筆者は聞いたことがありませんが、 エネルギーを扱う技術者は、特に意識しなくても使っている知識と思います。

「頻度」や「お金」は「離散データ」や「計数データ」として扱えますが、合計の計算が日常的に行われています。

産業連関表

産業連関表は、 経済性のデータ解析 で使われるデータで、この分析を「産業連関分析」といいます。

産業連関表は、 一対評価 の部分に、付加的なデータを足した構造になっています。 エコロジーとエコノミーの関係を、ひとつのデータセットの形に表しています。 データ分析以前に、この形式で現象をまとめようとしている点がポイントです。 筆者は、 データフィジクス(データ物理学) のひとつの形と思っています。



尺度としての「お金」

順路 次は メタデータとメタ知識

Tweet データサイエンス教室