令和7年春期試験問題 午前Ⅰ 問2

AIにおける機械学習の過程において,過学習と疑われたときの解消方法として,最も適切なものはどれか。

  • 訓練した時と同じ精度を出すために,訓練データをテストデータとして使用する。
  • 精度を高めるために,元の訓練データに加工を施し,訓練データの量を増やす。
  • 予測した結果に近づけるために,モデルをより複雑にする。
  • より多くの未知のデータに対して予測できるように,汎化性能を下げる。
正解 問題へ
分野 :テクノロジ系
中分類:基礎理論
小分類:情報に関する理論
解説
過学習(オーバーフィッティング)は、機械学習のモデルが訓練データに過剰に適合してしまった状態を指します。

モデルが過学習に陥ると、訓練データに対しては良い精度を示しますが、未知のデータに対する予測精度が低下し、汎用性がないシステムとなってしまいます。過学習は、訓練データが少ない場合やモデルの複雑度が高い場合に特に起きやすくなります。
  • 機械学習では、データセットを訓練用・検証用・テスト用の3つのサブセットに分けて使うのが基本です。テスト用(本試験用)には訓練に使用していない未知のデータを使用します。訓練データをテストデータとして使えば高い精度を示すのは当然で、過学習の解消にはなりません。
  • 正しい。元の訓練データを変換・加工してデータ数を水増しする手法は、データ拡張と呼ばれ、少ないデータセットでも機械学習を可能とするものです。モデルが多様なパターンを学習できるようになるため、過学習が抑制され、汎化能力の高いモデルを構築できます。データ拡張は過学習を防ぐ有効な手段の一つです。
  • モデルの複雑さを上げると、訓練データには良く適合しますが、未知のデータには対応しにくくなります。過学習を悪化させる方向に作用するため不適切です。
  • 汎化性能とは『未知のデータにどれだけ対応できるか』を示す指標です。過学習とはモデルが訓練データに過剰適合してしまい未知のデータに対応できない状態、すなわち汎化性能が低い状態を指します。汎化性能を下げるということは、過学習を助長するため不適切です。

Pagetop