Kimi AI App Try Now

Kimi modelių apžvalga: K2.5 galimybės ir savybės

Atraskite naujos kartos Moonshot AI ekosistemą – nuo galingo 1T MoE architektūros K2.5 tiek efektyvaus Kimi Linear vietiniam diegimui.

Išbandyti dabar

Kimi modelių apžvalga

Kimi modelių apžvalga

„Moonshot AI“ platforma „Kimi“ siūlo įspūdingą dirbtinio intelekto modelių asortimentą, pagrįstą 1 trilijono parametrų „Mixture-of-Experts“ (MoE) architektūra. Pagrindinis modelis „Kimi K2.5“, išleistas 2026 m. sausį, pasižymi integraliomis multimodalinėmis galimybėmis, „Agent Swarm“ koordinavimu ir našumu, kuris konkuruoja su „GPT-5.2“ bei „Claude Opus 4.5“. Nesvarbu, ar jums reikia greitų atsakymų į paprastas užklausas, gilaus loginio mąstymo sudėtingoms problemoms spręsti, ar autonominių agentų darbo eigų, „Kimi“ modelių šeima apima visus naudojimo atvejus.

Kryptinga Kimi ekosistemos plėtra sparčiai progresavo nuo „K1.5“ pasirodymo 2025 m. sausį. Kiekviena paskesnė versija išplėtė galimybes nuo teksto analizės iki pilno multimodalinio suvokimo, apimančio vaizdo įrašus, paveikslėlius ir dokumentus. Visi „K2“ serijos modeliai naudoja tą patį 1T MoE pagrindą, tačiau skiriasi mokymo duomenimis, funkcijų rinkiniais ir veikimo režimais. Visas „K2.5“ modelis yra atvirojo kodo, platinamas pagal modifikuotą MIT licenciją ir pasiekiamas „Hugging Face“ platformoje savarankiškam diegimui.

Modelis Išleidimo data Parametrai Konteksto langas Pagrindinės savybės
Kimi K2.5 2026 m. sausis 1T MoE (32B aktyvūs) 256K žetonų Multimodalumas, Agent Swarm, atvirasis kodas
Kimi K2-Instruct-0905 2025 m. rugsėjis 1T MoE (32B aktyvūs) 256K žetonų Geresnis programavimas, išplėstas kontekstas
Kimi K2 2025 m. liepa 1T MoE (32B aktyvūs) 128K žetonų Pirmasis 1T MoE, atvirojo kodo bazė
Kimi Linear 2025 m. spalis 48B MoE (3B aktyvūs) 128K žetonų Lengvasvoris, efektyvus skaičiavimas
Kimi-VL 2025 m. balandis 16B MoE (3B aktyvūs) 128K žetonų Vaizdo ir kalbos modelis, kompaktiškas
Kimi K1.5 2025 m. sausis Nenurodyta 128K žetonų Loginis mąstymas lygus OpenAI o1

Pagrindinis modelis Kimi K2.5

Pagrindinis modelis Kimi K2.5

„Kimi K2.5“ yra pažangiausias asortimento modelis, apmokytas naudojant maždaug 15 trilijonų mišrių vaizdo ir teksto žetonų, vykdant nuolatinį išankstinį mokymą ant „K2“ bazės. Architektūroje naudojami 384 ekspertai, iš kurių 8 suaktyvinami kiekvienam žetonui, pasitelkiant „Multi-Latent Attention“ (MLA) ir „SwiGLU" technologijas. Integralus multimodalinis dizainas apjungia „MoonViT-3D“ – 400 mln. parametrų vaizdo koduotuvą, kuris naudoja „NaViT“ pakavimą kintamos raiškos vaizdų apdorojimui.

Keturi veikimo režimai

„K2.5“ veikia keturiais skirtingais režimais, optimizuotais įvairioms darbo eigoms. „K2.5 Instant“ pateikia greitus atsakymus be gilaus mąstymo paprastoms užklausoms. „K2.5 Thinking“ suaktyvina minčių grandinės procesus sudėtingoms problemoms analizuoti. „K2.5 Agent“ įgalina vieno agento įrankių naudojimą autonominėms užduotims atlikti. „K2.5 Agent Swarm“ koordinuoja iki 100 specializuotų subagentų, dirbančių lygiagrečiai, o tai pagreitina vykdymą iki 4,5 karto.

Režimas Naudojimo atvejis Greitis Mąstymo gylis
K2.5 Instant Greiti atsakymai, paprastos užduotys Greičiausias Standartinis
K2.5 Thinking Matematika, logika, analizė Vidutinis Gilus mąstymas
K2.5 Agent Įrankių naudojimas, programavimas Priklauso nuo užduoties Agentinis mąstymas
K2.5 Agent Swarm Tyrimai, kelių etapų eigos 4,5 karto greičiau Paskirstytas agentų tinklas

Našumo testų rezultatai

„K2.5“ pasiekia 96,1 % rezultatą „AIME 2025“ teste (palyginimui, GPT-5.2 pasiekia 100 %), 98,0 % „MATH-500“ ir 87,6 % „GPQA-Diamond“ testuose. Programavimo srityje modelis surinko 83,1 % „LiveCodeBench v6“ teste, gerokai lenkdamas „Claude Opus 4.5“ rezultatą (64,0 %). „Agent Swarm“ režimas pasiekė 50,2 % „Humanity's Last Exam“ teste naudojant įrankius, o tai viršijo „GPT-5.2“ rezultatą pasiekiant 76 % mažesnes sąnaudas. Vaizdo suvokimo galimybės apima 92,3 % „OCRBench“ ir 86,6 % „VideoMMMU“ testuose.

Bazinis modelis Kimi K2

Bazinis modelis Kimi K2

2025 m. liepą išleistas „K2“ buvo pirmasis „Moonshot AI“ 1 trilijono parametrų MoE modelis ir pagrindas visiems vėlesniems „K2“ serijos leidimams. Išleistas su MIT licencija, jis įtvirtino 384 ekspertų architektūrą su 32B aktyvių parametrų, kurią paveldėjo „K2.5“. Originali versija palaikė 128K žetonų kontekstą, kuris 2025 m. rugsėjį po „Instruct“ atnaujinimo buvo išplėstas iki 256K.

„Kimi K2-Instruct-0905“ versija atnešė reikšmingų programavimo patobulinimų ir padidintą konteksto langą. Šis atnaujinimas surinko 94,5 % „HumanEval“ teste, demonstruodamas stiprius kodo generavimo gebėjimus. „Instruct“ variantas išlieka prieinamas kaip tik teksto apdorojimo alternatyva naudotojams, kuriems nereikia multimodalinio funkcionalumo.

Lengvasvoriai modeliai efektyviam darbui

Lengvasvoriai modeliai efektyviam darbui

Kimi Linear

2025 m. spalį pristatytas „Kimi Linear“ naudoja kompaktišką 48B MoE architektūrą su tik 3B aktyvių parametrų vienam žetonui. Sukurtas diegimui įrenginiuose ir ribotų išteklių aplinkose, jis pasižymi stebėtinai geru našumu, palyginti su savo dydžiu. Modelis palaiko 128K žetonų kontekstą ir efektyviai veikia plataus vartojimo aparatinėje įrangoje, todėl tinka vietiniam diegimui bei mobiliosioms programėlėms, kur delsa yra svarbesnė už maksimalų pajėgumą.

Kimi-VL

„Kimi-VL“, išleistas 2025 m. balandį, yra 16B parametrų MoE vaizdo ir kalbos modelis su 3B aktyvių parametrų. Tai buvo pirmasis „Moonshot AI“ atvirojo kodo multimodalinis modelis, skirtas užduotims, jungiančioms vaizdo supratimą su teksto generavimu. Nors sudėtingesnėse srityse jį pakeitė „K2.5“, „Kimi-VL“ išlieka vertingas atliekant lengvasvores vaizdo analizės užduotis, kurioms viso 1T modelio naudojimas būtų perteklinis.

Tinkamiausio Kimi modelio pasirinkimas

Tinkamiausio Kimi modelio pasirinkimas

Modelio pasirinkimas priklauso nuo jūsų specifinių reikalavimų galimybėms, kainai ir diegimo lankstumui. Šios gairės padės suderinti poreikius su optimaliu pasirinkimu.

  • Maksimalių galimybių bendrosios paskirties AI naudojimui pasitelkite „K2.5“ per API arba oficialią svetainę.
  • Autonominėms darbo eigoms ir tyrimams geriausiai tinka „K2.5 Agent“ arba „Agent Swarm“ režimai.
  • Savarankiškam diegimui su visomis funkcijomis atsisiųskite „K2.5“ iš „Hugging Face“ ir naudokite su „vLLM“ ar „Docker“.
  • Ribotų išteklių aplinkoms rinkitės „Kimi Linear“ dėl jo mažesnio reikalavimo aparatinei įrangai.
  • Paprastoms vaizdo analizės užduotims taupant lėšas naudokite „Kimi-VL“ modelį.
  • Tekstiniam loginiam mąstymui be vizualinių poreikių tinka „K2-Instruct-0905“ variantas.

Dažnai užduodami klausimai

Kuris Kimi modelis yra geriausias?

„Kimi K2.5“ yra pajėgiausias modelis pagal visus rodiklius: mąstymą, kodavimą, vaizdo suvokimą ir agentų užduotis. Jis pirmauja „OCRBench“ su 92,3 % rezultatu. Naudotojams, kuriems nereikia maksimalaus našumo, „Kimi Linear“ siūlo puikias galimybes už gerokai mažesnę skaičiavimo kainą.

Ar Kimi modeliai yra nemokami?

Šiuo metu visi „Kimi“ modeliai yra nemokamai pasiekiami per programėles ir svetainę. API prieiga naudoja mokėjimo už žetonus modelį, prasidedantį nuo 0,60 USD už milijoną įvesties žetonų „K2.5“ modeliui. Atvirojo kodo svoriai „Hugging Face“ platformoje yra nemokami atsisiųsti ir naudoti komerciniais tikslais pagal licenciją.

Ar galiu paleisti Kimi modelius vietiniame kompiuteryje?

„K2.5“ ir „K2“ yra pasiekiami „block-fp8“ formatu ir gali būti diegiami per „vLLM“ arba „Transformers“. Visam 1T modeliui reikia didelių GPU išteklių. Vietiniam diegimui paprastesnėje įrangoje labiau tinka „Kimi Linear“ versija.

Kuo skiriasi K2 ir K2.5 modeliai?

„K2.5“ prideda integralų multimodalų suvokimą, „Agent Swarm“ režimą ir reikšmingus našumo patobulinimus. „K2“ yra skirtas tik tekstui su 128K kontekstu, o „K2.5“ natūraliai apdoroja vaizdus, vaizdo įrašus ir dokumentus su 256K konteksto langu.

Kas yra Agent Swarm režimas?

Tai režimas, leidžiantis Kimi K2.5 koordinuoti iki 100 specializuotų subagentų vienu metu, pagreitinant tyrimų ir užduočių vykdymą iki 4,5 karto.

Koks yra Kimi K2.5 konteksto lango dydis?

Kimi K2.5 palaiko 256K žetonų konteksto langą, todėl gali apdoroti itin ilgus dokumentus ir sudėtingas instrukcijas.

Ar Kimi K2.5 yra atvirojo kodo?

Taip, visas „K2.5“ modelis yra atvirojo kodo ir platinamas pagal modifikuotą MIT licenciją.