Kimi AI App Try Now

Kimi API: Programerski vodič za K2.5 model

Iskusite snagu MoE arhitekture s prozorom od 256K tokena i potpunom OpenAI kompatibilnošću za vaš sljedeći AI projekt.

Započnite integraciju

Pregled Kimi API sučelja

Pregled Kimi API sučelja

Kimi API omogućuje pristup modelu Kimi K2.5 tvrtke Moonshot AI, koji predstavlja MoE model s 1 bilijun parametara, izvornim multimodalnim mogućnostima i kontekstnim prozorom od 256K tokena. Sučelje temeljeno na REST arhitekturi dopušta jednostavnu integraciju u aplikacije koje zahtijevaju napredno logičko zaključivanje, vizualno razumijevanje, analizu dokumenata i radne tokove s više agenata. U 2026. godini usluga je dostupna putem službene Moonshot platforme te pružatelja usluga trećih strana kao što su OpenRouter, Together AI i NVIDIA NIM.

Migracija za programere koji već poznaju OpenAI ekosustav iznimno je jednostavna. API zadržava potpunu kompatibilnost s OpenAI SDK strukturom, zahtijevajući samo promjenu osnovnog URL-a i API ključa. Autentifikacija se oslanja na standardnu „Bearer" token autorizaciju. Službeni SDK-ovi za Python i Node.js upravljaju zahtjevima, dok otvorene težine modela na platformi Hugging Face omogućuju samostalno hostiranje za timove koji žele potpunu kontrolu nad svojom infrastrukturom.

Ono što izdvaja ovaj API je kombinacija golemog kontekstnog prozora i Agent Swarm načina rada uz cijene koje su znatno povoljnije od konkurenata poput modela Claude Opus 4.5. Kompleksni RAG sustavi postaju jednostavniji jer model može obraditi čitave skupove dokumentacije u jednom prolazu, istovremeno analizirajući slike, grafikone i video sadržaj.

Značajka Detalji
Trenutni model Kimi K2.5 (kimi-k2.5)
Kontekstni prozor 262.144 tokena (256K)
Vrste unosa Tekst, slike, video, dokumenti
Autentifikacija Bearer token putem Authorization zaglavlja
SDK podrška Python, Node.js (OpenAI kompatibilnost)
Pružatelji usluga Moonshot Official, OpenRouter, Together AI, NVIDIA NIM

API krajnje točke odražavaju strukturu OpenAI sučelja za generiranje teksta, podržavajući JSON odgovore, strujanje podataka i pozivanje funkcija za izgradnju agentnih radnih tokova. Pristup platformi Kimi putem API-ja omogućuje korištenje punog potencijala K2.5 verzije, uključujući sve operativne načine rada: Instant, Thinking, Agent i Agent Swarm.

  • Korištenje krajnjih točaka kompatibilnih s OpenAI-jem smanjuje potrebu za refaktoriranjem koda.
  • Strujanje odgovora omogućuje progresivno ažuriranje korisničkog sučelja tijekom generiranja.
  • Pozivanje funkcija olakšava strukturirane izlaze i integraciju s vanjskim alatima.
  • Izvorni multimodalni unos prihvaća vizualne materijale zajedno s tekstualnim promptovima.
  • Automatsko predmemoriranje konteksta smanjuje troškove ponovljenog unosa za 75%.

Cijene korištenja usluge

Cijene korištenja usluge

Kimi K2.5 nudi konkurentne cijene kod različitih dobavljača, pri čemu automatsko predmemoriranje konteksta na službenom API-ju drastično smanjuje troškove za ponovljene upite.

Pružatelj usluge Unos (po 1M tokena) Izlaz (po 1M tokena) Predmemorirani unos
Moonshot Official 0,60 $ 3,00 $ 0,15 $ (75% popust)
OpenRouter 0,45 $ 2,20 $ Varira
Together AI 0,50 $ 2,80 $ Varira

Trenutno ove cijene pozicioniraju Kimi K2.5 kao rješenje koje je otprilike četiri puta jeftinije od modela Claude Opus 4.5 za ekvivalentne duljine konteksta. Funkcija predmemoriranja aktivira se transparentno kada se isti sistemski prompt ili prefiks dokumenta koristi u više uzastopnih zahtjeva.

Ograničenja i razine računa

Ograničenja i razine računa

Službeni API koristi sustav razina koji se temelji na ukupnom iznosu nadoplate računa. Više razine korisnicima omogućuju veći broj istodobnih zahtjeva i bržu obradu podataka u sekundi.

Razina Ukupna nadoplata Istodobni zahtjevi Zahtjevi po minuti
Tier 1 10 $ 50 200
Tier 2 100 $ 100 500
Tier 3 500 $ 300 2.000
Tier 5 3.000 $ 1.000 10.000

Za poslovne sustave koji zahtijevaju veće kapacitete, dostupni su prilagođeni Enterprise planovi putem izravnog kontakta s prodajnim timom tvrtke Moonshot AI.

Multimodalna upotreba API sučelja

Multimodalna upotreba API sučelja

Izvorna multimodalna arhitektura modela Kimi K2.5 omogućuje slanje slika i videozapisa izravno u API zahtjevima. Vizualni enkoder MoonViT-3D obrađuje ulaze različitih razlučivosti bez potrebe za predobradom ili promjenom veličine na strani klijenta.

response = client.chat.completions.create(
    model="kimi-k2.5",
    messages=[
        {
            "role": "user",
            "content": [
                {"type": "text", "text": "Opiši ovaj grafikon i izdvoji podatke."},
                {"type": "image_url", "image_url": {"url": "https://example.com/grafikon.png"}}
            ]
        }
    ]
)

Vizualne sposobnosti modela ostvaruju visoke rezultate na mjerilima kao što su OCRBench i InfoVQA. To ga čini posebno učinkovitim za zadatke digitalizacije dokumenata, analize kompleksnih grafikona i ekstrakcije strukturiranih podataka iz vizualnih materijala.

Često postavljana pitanja

Je li API kompatibilan s OpenAI SDK-om?

Da, sučelje je u potpunosti kompatibilno. Potrebno je samo usmjeriti osnovni URL na službenu Moonshot adresu i koristiti vlastiti API ključ bez mijenjanja logike aplikacije.

Koliki je maksimalni kontekstni prozor?

Kimi K2.5 podržava do 262.144 tokena (256K) po pojedinačnom zahtjevu, što omogućuje obradu iznimno dugih dokumenata ili cijelih programskih baza.

Kako radi predmemoriranje konteksta?

Sustav automatski prepoznaje ponovljene segmente teksta (npr. sistemske instrukcije) i smanjuje cijenu tih tokena za 75%, na 0,15 USD po milijunu.

Mogu li samostalno hostirati model?

Da, model je dostupan na Hugging Face platformi pod modificiranom MIT licencom, ali zahtijeva snažne GPU resurse zbog 1T parametara.

Koje vrste datoteka API podržava?

API podržava tekstualne unose, slike, videozapise i dokumente zahvaljujući svojoj izvornoj multimodalnoj arhitekturi.

Gdje mogu dobiti API ključ?

API ključ možete generirati nakon registracije na službenom portalu platform.moonshot.ai u odjeljku API Keys.