機械学習 は、モデルやアルゴリズムが注目されることが多いです。 追加学習や再学習は、机上で勉強している時には、何の話をしているのかがわかりにくい話題です。
しかし、機械学習を現実の場面で使って、うまく行かないような時に、初めて話題になります。 AIの説明可能性・解釈可能性 が低いと起きやすいです。
AIの劣化問題は、現実の場面で、機械学習のモデルを使い始めると起きる問題です。
AIを作った時には、十分な精度なことを確認して使い始めたのに、しばらくたってから、起きます。 極端な場合は、試運転を開始した直後から起きることがあります。
原因はシンプルです。 学習した時のデータの分布と、しばらくたってからの分布がズレて来る事で起きます。
例えば、「学習データでは、温度が50℃以上だと、不良品が発生していた。今は、60℃以上でも不良は出ていない。」といった事が、工場では起きます。 工場は、様々な条件がうまく釣り合って成り立っているので、単純な経験則でモデルを作ると起こりがちです。
再学習は、文字通り、学習用のデータセットをもう一度準備して行う学習です。
追加学習は、学習用のデータセットに、新しいデータセットを足す再学習です。
逐次学習 は、追加学習の一種です。
「製造現場の突発的な変動の影響を受けたデータにおける異常検知の改善」 杉原哲朗 著 OMRON TECHNICS 2023
https://www.omron.com/jp/ja/technology/omrontechnics/2023/OMT_Vol56_002JP.pdf
追加学習と再学習を自動で使い分けるアルゴリズムを紹介しています。
順路 次は ベイジアンネットワーク