交差検証法（Cross Validation） - AURA 用語集

データセットを複数の部分集合に分割し、それぞれを評価用として複数回モデル評価を行う統計的検証手法。限られたデータから信頼性の高い性能評価を実現し、過学習の検出とモデル選択に重要な役割を果たす。

主要手法：
・KFold：基本的なk分割
・StratifiedKFold：層化分割
・GroupKFold：グループ単位分割
・TimeSeriesSplit：時系列専用
・LeaveOneOut：極端な分割
・RepeatedKFold：複数回実行

基本手順：
1. データをk個に分割
2. k回の評価実行
3. 平均性能と標準偏差を算出
4. 安定した性能推定値を取得・機械学習モデルの性能評価
・ハイパーパラメータ最適化
・特徴量選択の効果検証
・モデル間の統計的比較
・小規模データでの信頼性確保
・アルゴリズム選択
・前処理手法の比較
・アンサンブル学習の構築
・実験再現性の確保
・学術研究での標準評価・scikit-learn model_selection
・Optuna（ハイパーパラメータ最適化）
・MLflow（実験管理）
・Weights & Biases
・Neptune.ai
・TensorBoard
・Ray Tune
・Hyperopt
・scikit-optimize・データ漏洩の厳格な防止
・適切なk値の選択
・計算コストとの兼ね合い
・時系列データでの特別な配慮
・結果の統計的有意性確認
・グループ依存の考慮
・分布変化への対応
・過度な最適化の回避