Rishikimi i Modeleve Kimi

Eksploroni fuqinë e inteligjencës artificiale multimodale me arkitekturën 1 trilion parametra MoE dhe agjentët inteligjentë.

Zbuloni Kimi K2.5

Përmbledhje Kimi K2.5 Modeli K2 Modelet e lehta Modeli K1.5 Si të zgjidhni FAQ

Përmbledhje e modeleve Kimi

Platforma Kimi nga Moonshot AI ofron një linjë mbresëlënëse modelesh të inteligjencës artificiale të ndërtuara mbi një arkitekturë Mixture-of-Experts me 1 trilion parametra. Modeli kryesor Kimi K2.5, i lançuar në janar 2026, ofron aftësi native multimodale, koordinim Agent Swarm dhe performancë në teste që rivalizon GPT-5.2 dhe Claude Opus 4.5. Pavarësisht nëse ju nevojiten përgjigje të shpejta për pyetje të thjeshta, arsyetim i thellë për probleme komplekse ose rrjedha pune med agjentë autonomë, familja e modeleve Kimi mbulon çdo rast përdorimi.

Ekosistemi Kimi ka evoluar me shpejtësi që nga lançimi i K1.5 në janar 2025. Çdo lëshim pasardhës ka zgjeruar aftësitë nga arsyetimi vetëm me tekst në kuptimin e plotë multimodal me video, imazhe dhe dokumente. Të gjitha modelet e serisë K2 ndajnë të njëjtin fundament 1T MoE, por ndryshojnë në të dhënat e trajnimit, grupet e veçorive dhe modalitetet operacionale. Plotësisht modeli K2.5 është me burim të hapur nën një Licencë MIT të Modifikuar, i disponueshëm në Hugging Face për vendosje në serverë privatë.

Modeli	Data e lançimit	Parametrat	Dritarja e kontekstit	Veçoritë kryesore
Kimi K2.5	Janar 2026	1T MoE (32B aktivë)	256K token	Multimodal nativ, Agent Swarm, burim i hapur
Kimi K2-Instruct-0905	Shtator 2025	1T MoE (32B aktivë)	256K token	Kodim i përmirësuar, kontekst i zgjeruar
Kimi K2	Korrik 2025	1T MoE (32B aktivë)	128K token	Baza e parë 1T MoE, burim i hapur
Kimi Linear	Tetor 2025	48B MoE (3B aktivë)	128K token	I lehtë, inferencë efikase
Kimi-VL	Prill 2025	16B MoE (3B aktivë)	128K token	Vision-language, multimodal kompakt
Kimi K1.5	Janar 2025	E papublikuar	128K token	Arsyetim i barabartë me OpenAI o1

Modeli kryesor Kimi K2.5

Kimi K2.5 përfaqëson modelin më të fuqishëm në linjë, i trajnuar në rreth 15 trilionë token të përzier vizualë dhe tekstualë përmes para-trajnimit të vazhdueshëm mbi bazën K2. Arkitektura përdor 384 ekspertë me 8 të aktivizuar për çdo token, Multi-Latent Attention (MLA) dhe aktivizimin SwiGLU. Dizajni nativ multimodal integron MoonViT-3D, një kodues vizual me 400M parametra që përdor paketimin NaViT për hyrjen e imazheve me rezolucion të ndryshueshëm.

Katër modalitete operacionale

K2.5 operon në katër modalitete të dallueshme, secili i optimizuar për rrjedha të ndryshme pune. K2.5 Instant ofron përgjigje të shpejta pa proces arsyetimi për kërkesa të thjeshta. K2.5 Thinking aktivizon arsyetimin varg-mendimi për probleme komplekse. K2.5 Agent mundëson përdorimin e mjetetve nga një agjent i vetëm për përfundimin e detyrave autonome. K2.5 Agent Swarm koordinon deri në 100 nën-agjentë të specializuar që punojnë në paralel, duke reduktuar kohën e ekzekutimit me 4,5 herë.

Modaliteti	Rasti i përdorimit	Shpejtësia	Thellësia e arsyetimit
K2.5 Instant	Përgjigje të shpejta, detyra të thjeshta	Më e shpejta	Standarde
K2.5 Thinking	Matematikë, logjikë, analizë komplekse	E moderuar	Varg-mendimi i thellë
K2.5 Agent	Përdorim mjetesh, ekzekutim kodi, lundrim	Varet nga detyra	Arsyetim agjentik
K2.5 Agent Swarm	Kërkim kompleks, rrjedha pune me shumë hapa	4,5x më shpejt se një agjent	Arsyetim i shpërndarë

Performanca në teste

K2.5 arrin 96,1% në AIME 2025 (GPT-5.2: 100%), 98,0% në MATH-500 dhe 87,6% në GPQA-Diamond. Në kodim, ky model shënon 83,1% në LiveCodeBench v6, duke tejkaluar ndjeshëm Claude Opus 4.5 me 64,0%. Modaliteti Agent Swarm arriti 50,2% në Humanity's Last Exam duke përdorur mjete, duke kaluar rezultatin 45,5% të GPT-5.2 me një kosto 76% më të ulët. Aftësitë vizuale përfshijnë 92,3% në OCRBench dhe 86,6% në VideoMMMU.

Modeli bazë Kimi K2

I lançuar në korrik 2025, K2 ishte modeli i parë MoE me 1 trilion parametra nga Moonshot AI dhe baza për të gjitha lëshimet pasuese të serisë K2. I ofruar me burim të hapur nën Licencën MIT, ai vendosi arkitekturën me 384 ekspertë dhe 32B parametra aktivë që trashëgon K2.5. Lëshimi origjinal mbështeste 128K token kontekst, i cili më vonë u zgjerua në 256K me përditësimin Instruct të shtatorit 2025.

K2-Instruct-0905 solli përmirësime të ndjeshme në kodim dhe dritaren e zgjeruar të kontekstit 256K. Ky përditësim shënoi 94,5% në HumanEval, duke demonstruar aftësi të forta të gjenerimit të kodit. Varianti Instruct mbetet i disponueshëm si një alternativë vetëm me tekst për përdoruesit që nuk kanë nevojë për veçori multimodale.

Modelet e lehta

Kimi Linear

I prezantuar në tetor 2025, Kimi Linear përdor një arkitekturë kompakte 48B MoE me vetëm 3B parametra të aktivizuar për çdo token. I projektuar për pajisjet fundore dhe mjediset me burime të kufizuara, ai ofron një performancë çuditërisht të lartë në raport me madhësinë e tij. Modeli mbështet 128K token kontekst dhe ekzekutohet me efikasitet në pajisje të nivelit konsumator, duke e bërë atë të përshtatshëm për aplikacione celulare.

Kimi-VL

I lançuar në prill 2025, Kimi-VL është një model vision-language 16B MoE me 3B parametra aktivë. Ai ishte modeli i parë multimodal me burim të hapur nga Moonshot AI, i krijuar për detyra që kombinojnë kuptimin e imazhit me gjenerimin e tekstit. Megjithëse është zëvendësuar nga aftësitë e K2.5 për punë kërkuese, Kimi-VL mbetet i vlefshëm për detyra të lehta vizuale ku modeli i plotë 1T do të ishte i tepërt.

Modeli i arsyetimit Kimi K1.5

K1.5, i lançuar në janar 2025, shënoi hyrjen e Moonshot AI në modelet e avancuara të arsyetimit. Ai pretendoi barazi në performancë me OpenAI o1 në testet e matematikës dhe kodimit, duke prezantuar aftësitë e arsyetimit bazuar në mësimin përforcues. Megjithëse numri i saktë i parametrave nuk u bë kurrë i ditur, K1.5 tregoi se kompania mund të konkurronte në kufijtë e teknologjisë AI.

K1.5 u fokusua ekskluzivisht në arsyetimin e bazuar në tekst pa aftësi multimodale. Lëshimi i tij e pozicionoi Moonshot AI si një konkurrent serioz në fushën e modeleve të arsyetimit dhe hodhi bazat për serinë më të fuqishme K2. Përdoruesit që ende përdorin K1.5 duhet të kalojnë në K2.5, i cili e tejkalon atë në çdo metrikë duke shtuar aftësitë agjentike.

Si të zgjidhni modelin e duhur

Përzgjedhja e modelit varet nga kërkesat tuaja specifike për aftësinë, koston dhe fleksibilitetin e vendosjes. Udhëzuesi i mëposhtëm ndihmon në përshtatjen e rasteve të përdorimit me modelin optimal.

Përdorni K2.5 përmes API ose faqes zyrtare për inteligjencë artificiale me aftësi maksimale. Modaliteti Instant përpunon detyrat e thjeshta, ndërsa Thinking zgjidh arsyetimet komplekse.
Zgjidhni modelet K2.5 Agent ose Agent Swarm për rrjedha pune autonome dhe kërkime shkencore. Sistemi Swarm shkëlqen në detyra me shumë hapa që kërkojnë mbledhje paralele informacioni.
Shkarkoni K2.5 nga Hugging Face për vendosje në serverë lokalë me veçori të plota. Ky model mund të instalohet përmes vLLM, SGLang ose Docker.
Përdorni Kimi Linear për pajisje me burime të kufizuara hardware-ike. Ky model është ideal për mjedise ku performanca kërkohet në pajisje modeste.
Zgjidhni Kimi-VL për detyra të thjeshta vizuale me kosto të ulët. Ky model rekomandohet kur aftësitë e plota multimodale të K2.5 tejkalojnë nevojat tuaja aktuale.
Përdorni K2-Instruct-0905 për arsyetim vetëm me tekst me kosto më të ulët. Ky variant ruan fuqinë e arsyetimit 1T MoE pa përfshirë funksionet e vizionit.

Pyetjet e bëra më shpesh

Cili model Kimi është më i miri?

Kimi K2.5 është modeli më i aftë në të gjitha metrikat si arsyetimi, kodimi, vizioni dhe detyrat agjentike. Ai kryeson në OCRBench me 92,3% dhe shënon rezultate superiore në LiveCodeBench.

A janë modelet Kimi falas?

Po, të gjitha modelet Kimi janë të aksesueshme falas përmes faqes kimi.com dhe aplikacioneve celulare. Peshat e modeleve open-source në Hugging Face janë gjithashtu falas.

A mund të ekzekutoj modelet lokalisht?

Modelet K2.5 dhe K2 mund të ekzekutohen në serverë lokalë. Kimi Linear është i përshtatshëm edhe për pajisje konsumatore më pak të fuqishme.

Cili është ndryshimi midis K2 dhe K2.5?

K2.5 shton aftësi native multimodale (video/imazh), modalitetin Agent Swarm dhe përmirësime të mëdha në arsyetim krahasuar me K2.

Çfarë është arkitektura MoE?

Mixture-of-Experts (MoE) është një arkitekturë ku vetëm një pjesë e parametrave (p.sh. 32B nga 1T) aktivizohen për çdo kërkesë, duke rritur efikasitetin.

Sa është dritarja e kontekstit për Kimi K2.5?

Modeli Kimi K2.5 mbështet një dritare konteksti deri në 256K token.

A ka versione për përdorim në celular?

Po, Kimi Linear është i projektuar posaçërisht për pajisje celulare dhe mjedise me burime të kufizuara.