従量課金

カテゴリ: コスト・運用

使用した分だけ料金を支払う課金モデル。クラウドベースのLLMサービスで一般的で、APIリクエスト数やトークン数に応じて課金される。使用量が少ない場合はコストを抑えられるが、使用量が増えると予測不可能な高額請求のリスクがある。ローカルLLMホスティングは固定費用モデルとなるため、月間の推論リクエスト数が一定以上になると、従量課金よりもコスト効率が良くなる。

関連キーワード

従量課金