メインコンテンツへスキップ
レート制限は、SambaNova API の利用を適切に管理し、安定したパフォーマンスと信頼性の高いサービスを提供するための仕組みです。 一定の時間内に各ユーザーが呼び出せる API 回数を制限します。 レート制限は以下の単位で測定されます: 基本事項
  • RPM: 1分あたりのリクエスト数 (Requests per minute)
  • RPD: 1日あたりのリクエスト数 (Requests per day)
  • TPD: 1日あたりのトークン数 (Freeティアのみ)
基本事項
  • リクエスト とは、SambaNovaのAPIへの呼び出しを1回行うことを指します。
  • RPM または RPD のいずれかの上限に先に達した時点で、制限が適用されます。
  • 各リクエストのレスポンスには、現在のレート制限状況が含まれています (詳細は レート制限レスポンスヘッダー を参照)。
  • 制限に達した場合、レスポンス内にエラーメッセージが返されます (詳細は APIエラーコード を参照)。

SambaStack のレート制限

SambaStack 環境においては、レート制限はオプション機能であり、管理者がユーザーグループ単位で設定できます。

SambaCloud のレート制限ティア

SambaCloud では、以下のレート制限プランを提供しています。
  • 無料ティア (Free Tier): 支払い方法がアカウントに登録されていない場合に適用されます。
  • 開発者ティア (Developer Tier): 支払い方法が登録されている場合に適用されます。
  • エンタープライズティア (Enterprise Tier): エンタープライズ向けのレート制限プランです。詳細は 営業チーム にお問い合わせください。
支払い方法の登録は、Billing ページ をご参照ください。
以下に、開発者ティアと無料ティアのレート制限を示します。

本番モデルのレート制限

本番モデル (Production Model) は、本番環境での利用を想定しており、高速かつ高品質なパフォーマンス基準を満たしています。
開発元モデルID1分あたりのリクエスト数 (RPM)1日あたりのリクエスト数 (RPD)
DeepSeek
DeepSeek-R16012000
DeepSeek-R1-Distill-Llama-70B24048000
DeepSeek-V3-03246012000
DeepSeek-V3.16012000
Meta
Meta-Llama-3.3-70B-Instruct24048000
Meta-Llama-3.1-8B-Instruct1440288000

プレビューモデルのレート制限

プレビューモデル (Preview Model) は、評価・実験目的での利用を想定しており、本番環境での使用は推奨されません。 これらのモデルは提供のためのリソースが限定的であり、短期間で提供終了となる可能性があります。
開発元モデルID1分あたりのリクエスト数 (RPM)1日あたりのリクエスト数 (RPD)
Meta
Llama-4-Maverick-17B-128E-Instruct6012000
OpenAI
gpt-oss-120b6012000
Whisper-Large-v345090000
Qwen
Qwen3-32B306000
東京科学大学
Llama-3.3-Swallow-70B-Instruct-v0.46012000
Other
E5-Mistral-7B-Instruct6012000

レート制限レスポンスヘッダー

各 API リクエストのレスポンスには、現在のレート制限の使用状況を示す以下のヘッダーが含まれます。 RPM (1分あたりのリクエスト):
  • x-ratelimit-limit-requests
    • 1分あたりに許可される最大リクエスト数
  • x-ratelimit-remaining-requests
    • 現在の分 (minute) 枠内で、レート制限に達するまでに残っているリクエスト数
  • x-ratelimit-reset-requests
    • 1分あたりのリクエストクォータがリセットされるまでのエポック時間
RPD (1日あたりのリクエスト):
  • x-ratelimit-limit-requests-day
    • 1日あたりに許可される最大リクエスト数
  • x-ratelimit-remaining-requests-day
    • 現在の日次枠で、レート制限に達するまでに残っているリクエスト数
  • x-ratelimit-reset-requests-day
    • 日次クォータがリセットされるまでのエポック時間