レート制限とティア

公式APIでは, アカウントの累計リチャージ額に基づいたティア制を採用しています。上位のティアになるほど, 同時実行数やリクエストレートの上限が緩和されます。
| ティア | 累計リチャージ額 | 同時リクエスト数 | 1分あたりのリクエスト数 |
|---|---|---|---|
| ティア1 | 10ドル | 50 | 200 |
| ティア2 | 100ドル | 100 | 500 |
| ティア3 | 500ドル | 300 | 2,000 |
| ティア5 | 3,000ドル | 1,000 | 10,000 |
より高い制限が必要なアプリケーション向けには, Moonshot AIのセールスチームとの直接契約を通じたカスタムレート制限のエンタープライズプランも用意されています。利用規模に合わせて最適なプランを選択できます。
多様なアクセス方法

公式API以外にも, Kimi K2.5は複数のサードパーティプラットフォームやセルフホストオプションを通じて利用できます。
- OpenRouter:複数のAIプロバイダーを一括管理し, 統合された請求システムを提供します。モデル間のフォールバックが必要な場合に便利です。
- Together AI:低遅延な提供と競争力のある価格設定を実現した, 最適化済みの推論インフラストラクチャーです。
- NVIDIA NIM:NVIDIAの推論マイクロサービスプラットフォームを通じたエンタープライズ展開が可能です。
- セルフホスト:Hugging Faceよりモデルファイルをダウンロードして展開できます。1兆パラメータモデルの実行には, 膨大なGPUリソースが必要です。




