筆者は、2002年に社会人になりました。 全社員のPCには、標準ソフトとして、有償の統計ソフトが入っていて、日々の業務の中で使うのが当たり前になっている会社でした。
ただ、当時、 データマイニング と呼ばれ、現在は、 データサイエンス や 機械学習 と呼ばれる手法については、そのソフトには入っておらず、 それらが入っている有償ソフトは、大変高価だったため、2003年頃から、フリーソフトの調査をしていました。
上の表は、2012年頃に作成して、このサイトに掲載していたものです。
当時は、これらの使い分けがベストでした。
工場では、原因不明の品質異常を解決するタスクが、よくあります。
その時に、データから問題解決のヒントを得る方法として、データマイニングには、とても期待していました。
また、 「教師あり・教師なし」、「線形・非線形」、「目的変数が、量的・質的」、「説明変数が、量的・質的」といった分類は、筆者のタスクとは合いませんでした。 筆者のタスク向けの道具箱としては、もっと違う分類が欲しかったです。
MT法 と T法 のソフトを、VBAで作ってEXCEL上で使えるようにしたことがあります。
有償ソフトも含め、ネットや展示会で、時々、探すのですが、2024年現在でも、筆者が探しているのにぴったりのソフトがないです。
筆者が探していたソフトの要件のひとつに、インタラクティブなグラフがありました。 これは、RのPlotly でできることを、職場の同僚が作ったツールを見て知りました。 2020年のことです。
また、そのツールは、Rのshinyを使って作られていました。
shinyによって、「世の中にないのなら、自分で作る」ということが可能になりました。 こうして、 ウェブアプリR-EDA1 が完成しました。
今は、EXCELとR-EDA1で、やりたい分析がパパっとできるので、重宝しています。
R-EDA1の制作と同じ時期に、 「教師あり・教師なし」、「線形・非線形」、「目的変数が、量的・質的」、「説明変数が、量的・質的」といった分類ではない、分類を模索しました。
試行錯誤の結果、 EDA(探索的データ分析) としては、下記に落ち着きました。