読み方 : きょうかがくしゅう
正式名称 : Reinforcement Learning
強化学習とは、AI (人工知能) による機械学習のアルゴリズムのひとつで、システムが試行錯誤を繰り返して最適な行動を学習する技術で、長期的に最適な行動戦略(方策)を見つけ出します。
機械学習には、「強化学習」「教師あり学習」「教師なし学習」の3種類があります。
「教師あり学習」は、正解のラベル付きデータを用いて、未来の結果や分類を予測するモデルを訓練するもので、画像識別や、メールがスパムか判定するのに適しています。「教師なし学習」は、ラベルなしデータからパターンや構造を抽出して、顧客のクラスタリングやシステムの異常検知に利用されています。
一方、強化学習は長期的に最適な行動を選び続けることにより、複雑な問題の解決や自律的な意思決定に貢献します。例えば、ロボットの動作制御や自動運転車に用いられているほか、囲碁やチェス、ゲームのAIも自己対戦を重ねて熟練度を向上させています。