トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

現象の分析

データサイエンス には、いろいろなものが含まれていますが、分類の方法にはいくつかあります。

表データ(テーブルデータ)の見方の分類は、 EDA(探索的データ分析) のページにあります。

また、「予測がやりたい」、「データから仮説を検証したい」といった目的による分類もあります。

このページの以下の話は、扱いたい現象による分類です。 「因果・システム・時間」の3つの現象の違いは、分析の仕方の違いになっています。

現象の種類 : 因果・システム・時間

現象の種類として、因果・システム・時間に分けてみました。 他にもあるかもしれないですが、さしあたって、この3つでまとめています。

因果

「因果」は、「因果関係」とも呼ばれます。 原因の「因」、と結果の「果」を合わせた言葉です。

「因果」と言うと、難しい感じがしますが、「理由はこうだと思います。」、「〇〇だから、こうだ。」、と言った感じで、日常的な話題になっています。

システム

システムとして物事を見る時は、何かが起きている物は「全体」と考えて、「部分」に分け、部分同士の関係を考えます。

「部分」をどのように考えるのか、関係をどのように考えるのかで、様々な進め方ができます。

時間

物事は、時間の中で起きます。

データを見る時に、時間の順序を考慮すると、関係が表しやすくなって来ます。

因果・システム・時間の関係

現象の見方として、因果・システム・時間の3つに分けました。

範囲が狭かったり、複雑ではない現象の場合は、これらのどれか1つに注目するだけで解決に進められることもあります。 一方、社会や工場といったところで起きている現象については、3つの視点を使い分けたり、混ぜたりすると良いようです。

分析の種類

扱う現象が異なると、分析の方法も異なって来ます。

分析の要素 : データ・数理・論理・グラフ

それぞれの分析をする時は、データ・数理・論理・グラフが違って来ます。 これらの要素の間には関係があります。 例えば、相関という数理を視覚的に調べるグラフが散布図です。

下図は、あくまで一例です。 筆者が思い当たるものを書いています。
現象の分析

数理と論理は、数学では一体的に扱いますが、ここでは分けました。 数理というのは数式で表すようなことで、論理は数式で表せず言葉で表すような関係で、イメージしています。 数学では、数式は記号の関係のような感じですが、データサイエンスでは、数式に入る具体的な数字の大きさや、カテゴリの意味が重要なので、 このような解釈の仕方にしています。



順路 次は 因果推論

データサイエンス教室