フューショット学習は、モデルが限られた数のトレーニング例から新しい概念やタスクを学習できるようにする 機械学習 の手法である。これは、大規模なラベル付きデータセットを取得するのが高価または非現実的である場合に特に役立つ。大規模言語モデル(LLM)は、多くの場合、強力なフューショット学習能力を示す。

概要

従来の機械学習モデルは、通常、良好なパフォーマンスを達成するために大量のラベル付きデータを必要とする。しかし、多くの実世界のシナリオでは、ラベル付きデータは不足している。フューショット学習は、モデルが少数の例から一般化できるようにすることで、この課題に対処する。

手法

フューショット学習では、次のような多くの手法が使用される。

  • メタ学習: モデルはさまざまなタスクから学習することを学習するため、ほんの数例で新しいタスクにすばやく適応できる。
  • 転移学習: モデルは大規模なデータセットで事前トレーニングされた後、小規模なタスク固有のデータセットでファインチューニングされる。これは、大規模言語モデル で使用される事前トレーニングとファインチューニングの手法に似ている。
  • 距離学習: モデルは、さまざまな例を比較するために使用できる距離メトリックを学習する。これにより、モデルは既存の例との類似性に基づいて新しい例を分類できる。

利点

  • データ要件の削減: フューショット学習により、モデルのトレーニングに必要なラベル付きデータの量が削減される。
  • 迅速な適応: フューショット学習により、モデルは新しいタスクにすばやく適応できる。
  • 汎化の向上: フューショット学習は、モデルの汎化能力を向上させ、目に見えないデータで良好に機能できるようにする。

応用

フューショット学習は、以下を含む幅広いアプリケーションで使用されている。

  • 大規模言語モデル: LLM は、多くの場合、強力なフューショット学習能力を示し、ほんの数例で新しいタスクで良好に機能できるようにする。
  • 画像認識: フューショット学習を使用して、限られたラベル付きデータで画像認識モデルをトレーニングできる。
  • 自然言語処理: フューショット学習を使用して、テキスト分類や機械翻訳などのタスクのために NLP モデルをトレーニングできる。
  • ロボット工学: フューショット学習を使用して、限られた人間の監督下で新しいタスクを実行するようにロボットをトレーニングできる。