Kimi modelių apžvalga: K2.5 galimybės ir savybės

Atraskite naujos kartos Moonshot AI ekosistemą – nuo galingo 1T MoE architektūros K2.5 tiek efektyvaus Kimi Linear vietiniam diegimui.

Išbandyti dabar

Kimi modelių apžvalga Pagrindinis modelis Kimi K2.5 Bazinis modelis Kimi K2 Lengvasvoriai modeliai Loginio mąstymo modelis K1.5 Modelio pasirinkimas FAQ

Kimi modelių apžvalga

„Moonshot AI“ platforma „Kimi“ siūlo įspūdingą dirbtinio intelekto modelių asortimentą, pagrįstą 1 trilijono parametrų „Mixture-of-Experts“ (MoE) architektūra. Pagrindinis modelis „Kimi K2.5“, išleistas 2026 m. sausį, pasižymi integraliomis multimodalinėmis galimybėmis, „Agent Swarm“ koordinavimu ir našumu, kuris konkuruoja su „GPT-5.2“ bei „Claude Opus 4.5“. Nesvarbu, ar jums reikia greitų atsakymų į paprastas užklausas, gilaus loginio mąstymo sudėtingoms problemoms spręsti, ar autonominių agentų darbo eigų, „Kimi“ modelių šeima apima visus naudojimo atvejus.

Kryptinga Kimi ekosistemos plėtra sparčiai progresavo nuo „K1.5“ pasirodymo 2025 m. sausį. Kiekviena paskesnė versija išplėtė galimybes nuo teksto analizės iki pilno multimodalinio suvokimo, apimančio vaizdo įrašus, paveikslėlius ir dokumentus. Visi „K2“ serijos modeliai naudoja tą patį 1T MoE pagrindą, tačiau skiriasi mokymo duomenimis, funkcijų rinkiniais ir veikimo režimais. Visas „K2.5“ modelis yra atvirojo kodo, platinamas pagal modifikuotą MIT licenciją ir pasiekiamas „Hugging Face“ platformoje savarankiškam diegimui.

Modelis	Išleidimo data	Parametrai	Konteksto langas	Pagrindinės savybės
Kimi K2.5	2026 m. sausis	1T MoE (32B aktyvūs)	256K žetonų	Multimodalumas, Agent Swarm, atvirasis kodas
Kimi K2-Instruct-0905	2025 m. rugsėjis	1T MoE (32B aktyvūs)	256K žetonų	Geresnis programavimas, išplėstas kontekstas
Kimi K2	2025 m. liepa	1T MoE (32B aktyvūs)	128K žetonų	Pirmasis 1T MoE, atvirojo kodo bazė
Kimi Linear	2025 m. spalis	48B MoE (3B aktyvūs)	128K žetonų	Lengvasvoris, efektyvus skaičiavimas
Kimi-VL	2025 m. balandis	16B MoE (3B aktyvūs)	128K žetonų	Vaizdo ir kalbos modelis, kompaktiškas
Kimi K1.5	2025 m. sausis	Nenurodyta	128K žetonų	Loginis mąstymas lygus OpenAI o1

Pagrindinis modelis Kimi K2.5

„Kimi K2.5“ yra pažangiausias asortimento modelis, apmokytas naudojant maždaug 15 trilijonų mišrių vaizdo ir teksto žetonų, vykdant nuolatinį išankstinį mokymą ant „K2“ bazės. Architektūroje naudojami 384 ekspertai, iš kurių 8 suaktyvinami kiekvienam žetonui, pasitelkiant „Multi-Latent Attention“ (MLA) ir „SwiGLU" technologijas. Integralus multimodalinis dizainas apjungia „MoonViT-3D“ – 400 mln. parametrų vaizdo koduotuvą, kuris naudoja „NaViT“ pakavimą kintamos raiškos vaizdų apdorojimui.

Keturi veikimo režimai

„K2.5“ veikia keturiais skirtingais režimais, optimizuotais įvairioms darbo eigoms. „K2.5 Instant“ pateikia greitus atsakymus be gilaus mąstymo paprastoms užklausoms. „K2.5 Thinking“ suaktyvina minčių grandinės procesus sudėtingoms problemoms analizuoti. „K2.5 Agent“ įgalina vieno agento įrankių naudojimą autonominėms užduotims atlikti. „K2.5 Agent Swarm“ koordinuoja iki 100 specializuotų subagentų, dirbančių lygiagrečiai, o tai pagreitina vykdymą iki 4,5 karto.

Režimas	Naudojimo atvejis	Greitis	Mąstymo gylis
K2.5 Instant	Greiti atsakymai, paprastos užduotys	Greičiausias	Standartinis
K2.5 Thinking	Matematika, logika, analizė	Vidutinis	Gilus mąstymas
K2.5 Agent	Įrankių naudojimas, programavimas	Priklauso nuo užduoties	Agentinis mąstymas
K2.5 Agent Swarm	Tyrimai, kelių etapų eigos	4,5 karto greičiau	Paskirstytas agentų tinklas

Našumo testų rezultatai

„K2.5“ pasiekia 96,1 % rezultatą „AIME 2025“ teste (palyginimui, GPT-5.2 pasiekia 100 %), 98,0 % „MATH-500“ ir 87,6 % „GPQA-Diamond“ testuose. Programavimo srityje modelis surinko 83,1 % „LiveCodeBench v6“ teste, gerokai lenkdamas „Claude Opus 4.5“ rezultatą (64,0 %). „Agent Swarm“ režimas pasiekė 50,2 % „Humanity's Last Exam“ teste naudojant įrankius, o tai viršijo „GPT-5.2“ rezultatą pasiekiant 76 % mažesnes sąnaudas. Vaizdo suvokimo galimybės apima 92,3 % „OCRBench“ ir 86,6 % „VideoMMMU“ testuose.

Bazinis modelis Kimi K2

2025 m. liepą išleistas „K2“ buvo pirmasis „Moonshot AI“ 1 trilijono parametrų MoE modelis ir pagrindas visiems vėlesniems „K2“ serijos leidimams. Išleistas su MIT licencija, jis įtvirtino 384 ekspertų architektūrą su 32B aktyvių parametrų, kurią paveldėjo „K2.5“. Originali versija palaikė 128K žetonų kontekstą, kuris 2025 m. rugsėjį po „Instruct“ atnaujinimo buvo išplėstas iki 256K.

„Kimi K2-Instruct-0905“ versija atnešė reikšmingų programavimo patobulinimų ir padidintą konteksto langą. Šis atnaujinimas surinko 94,5 % „HumanEval“ teste, demonstruodamas stiprius kodo generavimo gebėjimus. „Instruct“ variantas išlieka prieinamas kaip tik teksto apdorojimo alternatyva naudotojams, kuriems nereikia multimodalinio funkcionalumo.

Lengvasvoriai modeliai efektyviam darbui

Kimi Linear

2025 m. spalį pristatytas „Kimi Linear“ naudoja kompaktišką 48B MoE architektūrą su tik 3B aktyvių parametrų vienam žetonui. Sukurtas diegimui įrenginiuose ir ribotų išteklių aplinkose, jis pasižymi stebėtinai geru našumu, palyginti su savo dydžiu. Modelis palaiko 128K žetonų kontekstą ir efektyviai veikia plataus vartojimo aparatinėje įrangoje, todėl tinka vietiniam diegimui bei mobiliosioms programėlėms, kur delsa yra svarbesnė už maksimalų pajėgumą.

Kimi-VL

„Kimi-VL“, išleistas 2025 m. balandį, yra 16B parametrų MoE vaizdo ir kalbos modelis su 3B aktyvių parametrų. Tai buvo pirmasis „Moonshot AI“ atvirojo kodo multimodalinis modelis, skirtas užduotims, jungiančioms vaizdo supratimą su teksto generavimu. Nors sudėtingesnėse srityse jį pakeitė „K2.5“, „Kimi-VL“ išlieka vertingas atliekant lengvasvores vaizdo analizės užduotis, kurioms viso 1T modelio naudojimas būtų perteklinis.

Loginio mąstymo modelis K1.5

„K1.5“, pasirodęs 2025 m. sausį, pažymėjo „Moonshot AI“ žingsnį į pažangių mąstymo modelių sritį. Jis deklaravo našumą, prilygstantį „OpenAI o1“ matematikos ir programavimo testuose, įdiegiant pastiprinamuoju mokymusi pagrįstas logines operacijas. Nors tikslus parametrų skaičius nebuvo atskleistas, „K1.5“ įrodė, kad gamintojas gali konkuruoti aukščiausiame AI mąstymo lygmenyje.

Šis modelis koncentravosi tik į tekstinį mąstymą be multimodalinio palaikymo. Jo pasirodymas padėjo pamatus pajėgesnei „K2“ serijai. Naudotojams, vis dar naudojantiems „K1.5“, rekomenduojama pereiti prie „K2.5“, kuris lenkia savo pirmtaką visais rodikliais ir prideda agentų bei vaizdo apdorojimo galimybes.

Tinkamiausio Kimi modelio pasirinkimas

Modelio pasirinkimas priklauso nuo jūsų specifinių reikalavimų galimybėms, kainai ir diegimo lankstumui. Šios gairės padės suderinti poreikius su optimaliu pasirinkimu.

Maksimalių galimybių bendrosios paskirties AI naudojimui pasitelkite „K2.5“ per API arba oficialią svetainę.
Autonominėms darbo eigoms ir tyrimams geriausiai tinka „K2.5 Agent“ arba „Agent Swarm“ režimai.
Savarankiškam diegimui su visomis funkcijomis atsisiųskite „K2.5“ iš „Hugging Face“ ir naudokite su „vLLM“ ar „Docker“.
Ribotų išteklių aplinkoms rinkitės „Kimi Linear“ dėl jo mažesnio reikalavimo aparatinei įrangai.
Paprastoms vaizdo analizės užduotims taupant lėšas naudokite „Kimi-VL“ modelį.
Tekstiniam loginiam mąstymui be vizualinių poreikių tinka „K2-Instruct-0905“ variantas.

Dažnai užduodami klausimai

Kuris Kimi modelis yra geriausias?

„Kimi K2.5“ yra pajėgiausias modelis pagal visus rodiklius: mąstymą, kodavimą, vaizdo suvokimą ir agentų užduotis. Jis pirmauja „OCRBench“ su 92,3 % rezultatu. Naudotojams, kuriems nereikia maksimalaus našumo, „Kimi Linear“ siūlo puikias galimybes už gerokai mažesnę skaičiavimo kainą.

Ar Kimi modeliai yra nemokami?

Šiuo metu visi „Kimi“ modeliai yra nemokamai pasiekiami per programėles ir svetainę. API prieiga naudoja mokėjimo už žetonus modelį, prasidedantį nuo 0,60 USD už milijoną įvesties žetonų „K2.5“ modeliui. Atvirojo kodo svoriai „Hugging Face“ platformoje yra nemokami atsisiųsti ir naudoti komerciniais tikslais pagal licenciją.

Ar galiu paleisti Kimi modelius vietiniame kompiuteryje?

„K2.5“ ir „K2“ yra pasiekiami „block-fp8“ formatu ir gali būti diegiami per „vLLM“ arba „Transformers“. Visam 1T modeliui reikia didelių GPU išteklių. Vietiniam diegimui paprastesnėje įrangoje labiau tinka „Kimi Linear“ versija.

Kuo skiriasi K2 ir K2.5 modeliai?

„K2.5“ prideda integralų multimodalų suvokimą, „Agent Swarm“ režimą ir reikšmingus našumo patobulinimus. „K2“ yra skirtas tik tekstui su 128K kontekstu, o „K2.5“ natūraliai apdoroja vaizdus, vaizdo įrašus ir dokumentus su 256K konteksto langu.

Kas yra Agent Swarm režimas?

Tai režimas, leidžiantis Kimi K2.5 koordinuoti iki 100 specializuotų subagentų vienu metu, pagreitinant tyrimų ir užduočių vykdymą iki 4,5 karto.

Koks yra Kimi K2.5 konteksto lango dydis?

Kimi K2.5 palaiko 256K žetonų konteksto langą, todėl gali apdoroti itin ilgus dokumentus ir sudėtingas instrukcijas.

Ar Kimi K2.5 yra atvirojo kodo?

Taip, visas „K2.5“ modelis yra atvirojo kodo ir platinamas pagal modifikuotą MIT licenciją.