従量課金
カテゴリ: コスト・運用
使用した分だけ料金を支払う課金モデル。クラウドベースのLLMサービスで一般的で、APIリクエスト数やトークン数に応じて課金される。使用量が少ない場合はコストを抑えられるが、使用量が増えると予測不可能な高額請求のリスクがある。ローカルLLMホスティングは固定費用モデルとなるため、月間の推論リクエスト数が一定以上になると、従量課金よりもコスト効率が良くなる。
関連キーワード
従量課金
使用した分だけ料金を支払う課金モデル。クラウドベースのLLMサービスで一般的で、APIリクエスト数やトークン数に応じて課金される。使用量が少ない場合はコストを抑えられるが、使用量が増えると予測不可能な高額請求のリスクがある。ローカルLLMホスティングは固定費用モデルとなるため、月間の推論リクエスト数が一定以上になると、従量課金よりもコスト効率が良くなる。