Kimi AI App Try Now

Prissætning for API

Prissætning for API

Kimi K2.5 tilbyder konkurrencedygtige priser på tværs af flere udbydere. Den automatiske caching af kontekst på den officielle API kan reducere udgifterne til input betydeligt ved genbrug af data.

Udbyder Input (per 1 mio. tokens) Output (per 1 mio. tokens) Cachet input
Moonshot Official 0,60 $ 3,00 $ 0,15 $ (75% rabat)
OpenRouter 0,45 $ 2,20 $ Varierer
Together AI 0,50 $ 2,80 $ Varierer

Disse priser placerer Kimi K2.5 som et økonomisk alternativ til modeller som Claude Opus 4.5. Den automatiske caching aktiveres i 2026 uden manuelle kodeændringer, når den samme systeminstruks eller det samme dokumentpræfiks genbruges i flere forespørgsler. Bemærk at priserne for API-forbrug kan ændre sig over tid.

Grænser for brug og niveauer

Grænser for brug og niveauer

Den officielle API benytter et niveaudelt system baseret på det samlede beløb, der er indbetalt på kontoen. Højere niveauer låser op for flere samtidige forespørgsler og højere hastigheder.

Niveau Samlet indbetaling Samtidige forespørgsler Forespørgsler per minut
Niveau 1 10 $ 50 200
Niveau 2 100 $ 100 500
Niveau 3 500 $ 300 2.000
Niveau 5 3.000 $ 1.000 10.000

For virksomheder med behov for højere grænser er det muligt at få skræddersyede planer. Dette kræver direkte kontakt til Moonshot AI's salgsafdeling for at aftale specifikke vilkår.

Ofte stillede spørgsmål

Er Kimi API kompatibel med OpenAI?

Ja, den er fuldt kompatibel. Du skal blot ændre base_url til api.moonshot.cn/v1 og bruge din egen API-nøgle. Funktioner som chat, streaming og strukturerede svar fungerer uden yderligere ændringer i koden.

Hvor stort er kontekstvinduet?

Kimi K2.5 understøtter op til 262.144 tokens per forespørgsel. Det giver plads til enorme mængder data, såsom hele kodebaser eller lange dokumenter, i en enkelt forespørgsel uden behov for manuel opdeling af teksten.

Hvordan fungerer caching af kontekst?

Systemet genkender automatisk, hvis det samme præfiks bruges i flere forespørgsler træk. Prisen for de cachede tokens er markant lavere end for nye tokens. Brugeren skal ikke foretage sig noget aktivt for at udnytte denne besparelse.

Kan jeg køre modellen selv?

Kimi K2.5 er udgivet under en modificeret MIT-licens. Modelvægte kan hentes fra Hugging Face og køres via værktøjer som vLLM eller Docker. For miljøer med begrænsede ressourcer findes Kimi Linear som et lettere alternativ.

Hvilke SDK'er understøttes officielt?

Officielle SDK'er er tilgængelige til Python og Node.js, men da API'en er OpenAI-kompatibel, kan ethvert OpenAI-understøttet bibliotek bruges.

Hvad koster input per million tokens?

Hos Moonshot Official koster standard input 0,60 $ per million tokens, mens cachet input kun koster 0,15 $.