野村 祐一郎
研究概要
画像認識や機械翻訳といったタスクを対象にした人工知能の学習には、正確に教師信号(答案)の付与された訓練データが必要不可欠です。しかし不正確なデータ収集技術や専門家のミスが原因で、訓練データ中に教師信号の誤り(ラベルノイズ)が発生します。そのようなデータセットで人工知能モデルを学習すると、誤った学習を進めてしまうため、モデルの予測性能は低下してしまいます。私は訓練データの教師信号に誤り(ラベルノイズ)がある場合でも、深層学習モデルの性能を落とさずに訓練する手法について研究しています。
深層学習を用いた画像分類におけるラベルノイズ問題
深層学習とは人工知能の一種で、大量の訓練データを学習してモデルのパラメータを自動で調整する手法であり、画像認識や自然言語処理等の分野で特に優れた成果を挙げています。しかし深層学習モデルは膨大な量のパラメータがあるため、ラベルノイズに対して過学習しやすい問題があります。
私はこれまでラベルノイズのある画像分類問題を対象として、深層学習の中間層から抽出される特徴量やモデルの出力を分析することで、ラベルノイズの訂正やサンプル選択を行う頑健な訓練手法を提案してきました。現在はさらなる頑健な訓練手法の確立を目標として、人と人工知能が協力してラベルノイズを訂正する手法の開発に取り組んでいます。