Perguntas frequentes
A API Kimi é compatível com o SDK da OpenAI?
Sim, é totalmente compatível. Basta alterar a URL base para api.moonshot.cn/v1 e utilizar a sua chave de API Moonshot. Funcionalidades como conclusões de chat, chamadas de funções e saídas estruturadas funcionam de forma idêntica, sem necessidade de alterar a lógica do código.
Qual é a janela de contexto máxima?
O Kimi K2.5 suporta até 262.144 tokens por requisição. Esta capacidade permite processar bases de código completas, conjuntos extensos de documentos e históricos de conversação prolongados numa única chamada, eliminando a necessidade de estratégias complexas de fragmentação de dados.
Como funciona o cache de contexto?
O cache é ativado automaticamente quando o mesmo prefixo surge em requisições consecutivas. Os tokens em cache custam apenas $0,15 por milhão, representando uma economia de 75%. O sistema gere este processo de forma transparente, sem intervenção manual do programador.
Posso alojar o modelo Kimi localmente?
O Kimi K2.5 é distribuído sob uma Licença MIT Modificada. Pode descarregar os pesos do Hugging Face e implementar o modelo utilizando ferramentas como vLLM ou Transformers. O modelo completo exige configurações multi-GPU, enquanto o Kimi Linear serve como alternativa mais leve para ambientes com menos recursos.
Quais tipos de entrada a API aceita?
A API é multimodal nativa, aceitando texto, imagens, vídeos e documentos simultaneamente.
Quais são os principais provedores da API Kimi?
Além da Moonshot AI oficial, pode ser acessada via OpenRouter, Together AI e NVIDIA NIM.






