トップページ | データサイエンスの成功事例集 | このサイトについて

R-EDA1の開発

筆者は、2002年に社会人になりました。 全社員のPCには、標準ソフトとして、有償の統計ソフトが入っていて、日々の業務の中で使うのが当たり前になっている会社でした。

ただ、当時、 データマイニング と呼ばれ、現在は、 データサイエンス機械学習 と呼ばれる手法については、そのソフトには入っておらず、 それらが入っている有償ソフトは、大変高価だったため、2003年頃から、フリーソフトの調査をしていました。

ソフト
上の表は、2012年頃に作成して、このサイトに掲載していたものです。 当時は、これらの使い分けがベストでした。

筆者が探していたソフト

工場では、原因不明の品質異常を解決するタスクが、よくあります。

その時に、データから問題解決のヒントを得る方法として、データマイニングには、とても期待していました。

また、 「教師あり・教師なし」、「線形・非線形」、「目的変数が、量的・質的」、「説明変数が、量的・質的」といった分類は、筆者のタスクとは合いませんでした。 筆者のタスク向けの道具箱としては、もっと違う分類が欲しかったです。

R-EDA1に先行して自作していたソフト

MT法T法 のソフトを、VBAで作ってEXCEL上で使えるようにしたことがあります。

結論:世の中には、欲しいソフトがない

有償ソフトも含め、ネットや展示会で、時々、探すのですが、2024年現在でも、筆者が探しているのにぴったりのソフトがないです。

Shinyが自作への突破口に

筆者が探していたソフトの要件のひとつに、インタラクティブなグラフがありました。 これは、RのPlotly でできることを、職場の同僚が作ったツールを見て知りました。 2020年のことです。

また、そのツールは、Rのshinyを使って作られていました。

shinyによって、「世の中にないのなら、自分で作る」ということが可能になりました。 こうして、 ウェブアプリR-EDA1 が完成しました。

今は、EXCELとR-EDA1で、やりたい分析がパパっとできるので、重宝しています。

EDAの体系化

R-EDA1の制作と同じ時期に、 「教師あり・教師なし」、「線形・非線形」、「目的変数が、量的・質的」、「説明変数が、量的・質的」といった分類ではない、分類を模索しました。

試行錯誤の結果、 EDA(探索的データ分析) としては、下記に落ち着きました。



データサイエンス教室