過学習（Overfitting） - AURA 用語集

機械学習モデルが学習データの特徴に過度に適合し、未知データへの汎化性能が著しく低下した状態。実用的なモデル構築における最重要課題の一つで、適切な対策が成功の鍵となる。

典型的兆候：
・訓練精度 >> テスト精度
・検証誤差の途中上昇
・新データでの性能低下
・複雑すぎるモデル構造

主要原因：
・モデル複雑度 > データ量
・特徴量数 > サンプル数
・訓練データの偏り
・過度な学習回数

対策手法：
・正則化（L1/L2）
・早期停止
・ドロップアウト
・データ拡張
・交差検証
・アンサンブル学習・画像認識モデルの汎化性能向上
・自然言語処理での性能安定化
・医療診断モデルの信頼性確保
・金融リスクモデルの堅牢性向上
・推薦システムの精度改善
・深層学習モデルの最適化
・時系列予測の安定化
・音声認識システム
・異常検知システム
・顧客行動予測・scikit-learn（正則化）
・TensorFlow/PyTorch（ドロップアウト）
・Keras EarlyStopping
・Optuna（ハイパーパラメータ最適化）
・MLflow（実験管理）
・Ridge/Lasso回帰
・RandomForest
・XGBoost正則化
・BatchNormalization・適切な検証戦略の設計
・十分な学習データの確保
・特徴量選択の慎重な実施
・継続的な性能監視
・ビジネス要件との整合性確認
・正則化パラメータの調整
・ドメイン知識の活用
・アンサンブル手法の検討