量子化認識訓練

カテゴリ: LLM運用技術

Quantization-Aware Trainingの略。訓練時に量子化を考慮してモデルを最適化する手法。ポストトレーニング量子化(PTQ)と比較して、精度損失を最小化できるが、計算コストが高くなる。訓練段階で量子化の影響をシミュレートし、量子化後も高精度を維持できるようモデルのパラメータを調整する。特に精度が重要な用途や、極端な量子化(4ビット以下)を行う場合に選択される。

関連キーワード

量子化認識訓練