データサイエンスの事例は、データが用意されているところから話が始まることが多いです。
そうでない場合は、「行政機関のホームページから、オープンデータを入手」、「会社のデータベースから、データを入手」ということはあります。
いずれにしても、電子データがどこかにあります。
「どこかにあるデータ」というのは、誰かが、「記録しておくと良さそう」、「測定しておくと良さそう」と思って、残しているものです。
そのため、誰も調べたことがない現象や、過去に調べたことがあっても現在のことはわからない現象などについては、データがありません。 そもそも何をデータとして見れば良いのかが、わからないこともあります。
筆者の場合は、工場で起きる原因不明の問題を解決する仕事をしていた時期があり、そういうことをするには、自分で測定する必要がありました。