Kimi AI sustav + K2.5 Model Review

Otkrijte najnapredniji MoE sustav od 1 bilijun parametara s nativnim multimodalnim mogućnostima.

Pregled Model K2.5 Model K2 Lagani modeli Model K1.5 Odabir modela FAQ

Pregled Kimi modela

Platforma Kimi kompanije Moonshot AI nudi impresivnu liniju AI modela izgrađenih na Mixture of Experts arhitekturi s 1 bilijun parametara. Vodeći model Kimi K2.5, predstavljen u januaru 2026. godine, donosi nativne multimodalne mogućnosti, Agent Swarm koordinaciju i performanse koje pariraju modelima GPT-5.2 i Claude Opus 4.5. Bez obzira na to trebate li brze odgovore na jednostavne upite, duboko logičko zaključivanje za složene probleme ili autonomne agentske tokove rada, porodica Kimi modela pokriva svaki slučaj upotrebe.

Ekosustav Kimi rapidno se razvijao od lansiranja modela K1.5 u januaru 2025. godine. Svako sljedeće izdanje proširilo je mogućnosti s tekstualnog zaključivanja na potpuno multimodalno razumijevanje videozapisa, slika i dokumenata. Svi modeli iz serije K2 dijele istu MoE osnovu od 1T parametara, ali se razlikuju po podacima za obuku, setovima funkcija i načinima rada. Cijeli model K2.5 dostupan je kao otvoreni kod pod Modified MIT licencom na platformi Hugging Face za samostalnu implementaciju.

Model	Datum izlaska	Parametri	Kontekstni prozor	Ključne značajke
Kimi K2.5	Januar 2026.	1T MoE (32B aktivnih)	256K tokena	Nativni multimodalni rad, Agent Swarm, otvoreni kod
Kimi K2-Instruct-0905	Septembar 2025.	1T MoE (32B aktivnih)	256K tokena	Poboljšano programiranje, prošireni kontekst
Kimi K2	Juli 2025.	1T MoE (32B aktivnih)	128K tokena	Prvi 1T MoE, baza otvorenog koda
Kimi Linear	Oktobar 2025.	48B MoE (3B aktivnih)	128K tokena	Lagan, efikasno izvođenje
Kimi-VL	April 2025.	16B MoE (3B aktivnih)	128K tokena	Vizualno-tozično razumijevanje, kompaktni multimodalni model
Kimi K1.5	Januar 2025.	Nije objavljeno	128K tokena	Paritet u zaključivanju s OpenAI o1

Glavni model Kimi K2.5

Kimi K2.5 predstavlja najsposobniji model u liniji, obučen na približno 15 bilijuna miješanih vizualnih i tekstualnih tokena kroz kontinuiranu predobuku na K2 bazi. Arhitektura koristi 384 eksperta od kojih se 8 aktivira po tokenu, uz Multi-Latent Attention (MLA) i SwiGLU aktivaciju. Nativni multimodalni dizajn integrira MoonViT-3D, vizualni enkoder od 400M parametara koji koristi NaViT pakiranje za unos slika varijabilne rezolucije.

Četiri načina rada

K2.5 funkcionira u četiri različita načina, od kojih je svaki optimiziran za specifične zadatke. K2.5 Instant pruža brze odgovore bez dubokog procesiranja za jednostavne upite. K2.5 Thinking aktivira lanac misli za rješavanje složenih logičkih problema. K2.5 Agent omogućuje korištenje alata za autonomno izvršavanje zadataka. K2.5 Agent Swarm koordinira do 100 specijaliziranih podagenata koji rade paralelno, što skraćuje vrijeme izvršavanja za 4,5 puta.

Način rada	Slučaj upotrebe	Brzina	Dubina zaključivanja
K2.5 Instant	Brzi odgovori, jednostavni zadaci	Najbrže	Standardna
K2.5 Thinking	Matematika, logika, složena analiza	Umjerena	Duboki lanac misli
K2.5 Agent	Korištenje alata, izvršavanje koda	Ovisi o zadatku	Agentsko zaključivanje
K2.5 Agent Swarm	Složena istraživanja, više koraka	4,5x brže od jednog agenta	Distribuirani višeagentski sustav

Rezultati referentnih testova

K2.5 postiže 96,1% na AIME 2025 testu (GPT-5.2: 100%), 98,0% na MATH-500 i 87,6% na GPQA-Diamond. U programiranju ostvaruje rezultat od 83,1% na LiveCodeBench v6, što značajno nadmašuje Claude Opus 4.5 koji postiže 64,0%. Agent Swarm način rada postigao je 50,2% na Humanity's Last Exam uz korištenje alata, nadmašujući GPT-5.2 koji je ostvario 45,5% uz 76% niže troškove. Vizualne sposobnosti uključuju 92,3% na OCRBench i 86,6% na VideoMMMU testu.

Osnovni model Kimi K2

Predstavljen u julu 2025. godine, K2 je bio prvi MoE model kompanije Moonshot AI s jednim bilijunom parametara i temelj za sva kasnija izdanja serije K2. Objavljen kao otvoreni kod pod MIT licencom, uspostavio je arhitekturu od 384 eksperta s 32B aktiviranih parametara koju nasljeđuje i K2.5. Originalno izdanje podržavalo je kontekst od 128K tokena, što je kasnije prošireno na 256K s ažuriranjem Instruct u septembru 2025. godine.

K2-Instruct-0905 donio je značajna poboljšanja u generiranju koda i prošireni prozor konteksta. Ovo ažuriranje postiglo je 94,5% na HumanEval testu, pokazujući snažne sposobnosti programiranja. Instruct varijanta ostaje dostupna kao alternativa bazirana isključivo na tekstu za korisnike kojima nisu potrebne multimodalne funkcije.

Lagani modeli za efikasnost

Kimi Linear

Lansiran u oktobru 2025. godine, Kimi Linear koristi kompaktnu 48B MoE arhitekturu sa samo 3B aktiviranih parametara po tokenu. Dizajniran za implementaciju na rubnim uređajima i okruženjima s ograničenim resursima, on pruža iznenađujuće dobre performanse s obzirom na svoju veličinu. Model podržava kontekst od 128K tokena i efikasno radi na korisničkom hardveru, što ga čini pogodnim za lokalnu upotrebu i mobilne aplikacije gdje je latencija važnija od maksimalnog kapaciteta.

Kimi-VL

Izdana u aprilu 2025. godine, Kimi-VL je vizualno-tekstualni MoE model od 16B parametara s 3B aktiviranih parametara. To je bio prvi multimodalni model otvorenog koda kompanije Moonshot AI, namijenjen zadacima koji kombiniraju razumijevanje slika s generiranjem teksta. Iako ga je nadmašio K2.5, Kimi-VL ostaje koristan alat za lagane vizualne zadatke gdje bi model od 1T parametara bio pretjeran resurs.

Model Kimi K1.5 za zaključivanje

K1.5, predstavljen u januaru 2025. godine, označio je ulazak kompanije Moonshot AI u sferu naprednih modela za logičko zaključivanje. Postigao je paritet s modelom OpenAI o1 na testovima matematike i programiranja, uvodeći zaključivanje temeljeno na potkrepljenom učenju. Iako točan broj parametara nikada nije objavljen, K1.5 je dokazao da Moonshot AI može konkurirati vodećim rješenjima u ovoj oblasti.

K1.5 se fokusirao isključivo na tekstualno zaključivanje bez multimodalnih mogućnosti. Njegovo izdanje pozicioniralo je Moonshot AI kao ozbiljnog konkurenta i postavilo temelje za napredniju seriju K2. Korisnicima koji još uvijek koriste K1.5 preporučuje se prijelaz na K2.5, koji nadmašuje prethodnika u svim testovima uz dodatak vizualnih i agentskih funkcija.

Kako odabrati pravi model

Odabir modela ovisi o vašim specifičnim zahtjevima za performansama, troškovima i fleksibilnosti implementacije. Sljedeći vodič pomaže u usklađivanju potreba s optimalnim izborom modela.

Korištenje za opće AI namjene: Odaberite K2.5 putem API-ja ili stranice kimi.com. Instant način rada rješava jednostavne zadatke, dok Thinking način rješava složene analize.
Izvođenje autonomnih radnih tokova: Koristite K2.5 Agent ili Agent Swarm način rada. Sustav rojeva izvrsno obavlja zadatke u više koraka koji zahtijevaju paralelno prikupljanje informacija.
Implementacija na vlastitim serverima: Preuzmite K2.5 s platforme Hugging Face i pokrenite ga putem vLLM, SGLang ili Docker tehnologija.
Lokalna upotreba na slabijem hardveru: Koristite Kimi Linear za okruženja s ograničenim resursima koja zahtijevaju sposoban AI na skromnijem hardveru.
Jednostavni vizualni zadaci uz uštedu: Upotrijebite Kimi-VL kada su vam pune multimodalne mogućnosti modela K2.5 prevelike za konkretni projekt.
Logičko zaključivanje bazirano samo na tekstu: Odaberite K2-Instruct-0905 ako vam ne treba vizualno prepoznavanje, ali želite snagu 1T MoE arhitekture.

Često postavljana pitanja

Koji je Kimi model najbolji?

Kimi K2.5 je najsposobniji model prema svim mjerenjima, uključujući zaključivanje, programiranje, vid i agentske zadatke. Postiže 96,1% na AIME 2025 i predvodi na OCRBench testu s 92,3%.

Da li su Kimi modeli besplatni?

Svi Kimi modeli su dostupni besplatno putem službene web stranice i mobilnih aplikacija. Pristup putem API-ja koristi sustav plaćanja po utrošenim tokenima.

Mogu li pokrenuti Kimi lokalno?

Modeli K2.5 i K2 mogu se implementirati putem vLLM ili SGLang biblioteka. Kimi Linear je najprikladniji za lokalno pokretanje na standardnom hardveru.

Koja je razlika između K2 i K2.5?

K2.5 donosi nativne multimodalne mogućnosti (slike, video), Agent Swarm način rada i veći kontekstni prozor od 256K tokena u odnosu na početnih 128K kod K2.

Tko je razvio Kimi AI?

Kimi AI modele razvila je kompanija Moonshot AI, fokusirajući se na MoE arhitekture s velikim brojem parametara.

Koji je prozor konteksta za model K2.5?

Kimi K2.5 podržava prozor konteksta do 256.000 tokena.

Što je Agent Swarm?

To je sustav koji koordinira do 100 specijaliziranih podagenata koji rade paralelno kako bi ubrzali izvršavanje složenih zadataka.