トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

データサイエンス教室

現象の分析

よく言われる事との違い のページに、 データサイエンス の目的として、「予測」と「原因分析」の2つがあることを書きました。

世の中では、 人工知能機械学習 が大変注目されていますので、「予測」の分野は大変な進歩をしています。

一方、「原因分析」の方は、 医学や経済学などで、「効果があると言えるのか?」、「原因と言えるのか?」といったことを証明する方法として、 昔から研究されていますが、「予測」に比べれば、かなり地味です。

現実の業務の中では、「変数Aと変数Bは相関が高いので、因果関係があるに違いない」、といった程度では終わらず、 「AとBは、何をどのように測定したデータなのか?」、 「データの値の範囲は、何で決まっているのか?」、といった具体的なことまで踏み込んで、 初めて次の段階に進めるようことが、よくあります。

筆者の場合は、 データと、現実に起こっている現象の関係を、いつも頭のどこかで考えるようにしています。





順路 次は 因果推論

Tweet