GPU推論
カテゴリ: ハードウェア・インフラ
Graphics Processing Unit(GPU)を使用してLLMの推論処理を実行すること。GPUは並列処理に優れており、行列演算が多いニューラルネットワークの推論で高速な処理が可能。NVIDIA A100、H100などのデータセンター向けGPUや、RTX 4090などのコンシューマー向けGPUが使用される。量子化モデルと組み合わせることで、比較的低スペックなGPUでも大規模なLLMを実行できるようになってきている。
関連キーワード
GPU推論