テンソルコア

カテゴリ: ハードウェア・インフラ

NVIDIA GPUに搭載されている、行列演算を高速化する専用ハードウェア。ディープラーニングの推論と訓練で必要な行列積演算を、従来のCUDAコアよりも高速に実行できる。FP16、INT8、INT4などの低精度演算を効率的に処理し、量子化モデルの推論で特に威力を発揮する。最新のH100 GPUでは、第4世代テンソルコアが搭載され、FP8やINT4演算のスループットが大幅に向上している。

関連キーワード

テンソルコア