概要
深層学習(Deep Learning)は、人間の脳神経回路を模した「ニューラルネットワーク」を多層(ディープ)に重ねることで、データから高度な特徴量を自動的に学習する 機械学習 の一分野である。
従来の機械学習では、専門家が手動でデータの特徴量を設計する必要があったが、深層学習ではモデル自身がデータから重要な特徴を学習するため、非常に高い性能を発揮することができる。
ニューラルネットワーク
ニューラルネットワークは、人間の脳の神経細胞(ニューロン)の仕組みにヒントを得た数理モデルである。入力層、中間層(隠れ層)、出力層から構成され、層の数を増やすことで、より複雑なパターンを学習できるようになる。深層学習は、この中間層が多数存在するニューラルネットワークを指す。
主なネットワークアーキテクチャ
タスクの性質に応じて、様々な種類のネットワークアーキテクチャが考案されている。
- CNN (Convolutional Neural Network): 畳み込みニューラルネットワーク。画像の空間的な特徴を捉えるのが得意で、画像認識の分野で広く用いられる。
- RNN (Recurrent Neural Network): 回帰型ニューラルネットワーク。時系列データやテキストのように、順序性のあるデータの扱いに長けている。
- Transformer: 2017 年に提案された比較的新しいアーキテクチャ。RNN の課題であった長期的な依存関係の学習を「アテンションメカニズム」によって克服し、現在の 自然言語処理 分野で主流のモデルとなっている。
応用例
深層学習は、現代の AI 技術のブレークスルーを牽引し、様々な分野で応用されている。
- 画像認識: 物体検出、顔認証、医療画像の解析など。
- 自然言語処理: 機械翻訳、文章生成、感情分析、大規模言語モデル など。
- 音声認識: スマートスピーカーの音声アシスタントや、リアルタイム文字起こしなど。
- 生成 AI: 指示に基づいて、実在しない人物の画像(GAN など)や、自然な文章を生成する。