AutoMLは、「Automated Machine Learning」の略で、日本語だと「自動機械学習」になります。
機械学習 を使う時は、「回帰分析、ニューラルネットワークなどの、どのモデルが良いのか?」や、 「特徴量エンジニアリングは何がベストか?」、という試行錯誤がありますが、 一般的な手順は決まっています。 「モデルは、単純なものから試す」、「特徴量は何も加工しないものから試す」といった手順です。
AutoMLは、その手順を自動化したソフトになっています。
AutoMLは、とにかく予測精度の高いモデルを作ろうとする方法になっているので、第1の使い道は、予測になります。
第2の使い道としては、
回帰分析系で高次元を2次元に圧縮して可視化
の方法として使って、発見的に
データマイニング
をしたり、
それを、
定量的な仮説の探索(因果推論)のヒントにする方法もありそうです。
Rには、automlやh2oというパッケージがあります。
automlは、 ニューラルネットワーク のパラメタ調整を自動でするツールです。 YとXの変数を指定するだけで動きます。 ただ、普通の回帰分析できれいにモデルが作れるようなデータに対して、 誤差が大きなモデルを作ったりしますし、それでいてけっこう時間もかかるところまで、筆者は確認しています。 2020年にpublishされた比較的新しいパッケージなので、様子見をしています。 Rによる回帰分析系で高次元を2次元に圧縮して可視化 では、automlを使えるようにはしてあります。
h2oは、設定が難しいですし、簡単なデータでもエラーが出て、筆者は結果を出せていないです。
PyCaretがあり、よくあるモデルは全部試して、結果を見せてくれる機能を持っています。
「データ×AI人材キャリア大全 職種・業務別に見る必要なスキルとキャリア設計」」 村上智之 著 翔泳社 2022
簡易なモデル実装については、AutoMLが代替手段になるものとしています。
automl
CRANにあるマニュアルです。
https://cran.r-project.org/web/packages/automl/automl.pdf
h2o
CRANにあるマニュアルです。「h2o.automl」というのが、AutoMLの機能です。
ニューラルネットワーク以外では、XGBoostなども入っています。
https://cran.r-project.org/web/packages/h2o/h2o.pdf
「Python実践AIモデル構築100本ノック」 下山輝昌・中村智・高木洋介 著 秀和システム 2021
様々な手法について、使い方がコンパクトにまとまっています。
AutoML:様々なモデルをまとめて評価する方法。PyCaretでできる。
順路 次は 追加学習と再学習