Përmbledhje e modeleve Kimi

Platforma Kimi nga Moonshot AI ofron një linjë mbresëlënëse modelesh të inteligjencës artificiale të ndërtuara mbi një arkitekturë Mixture-of-Experts me 1 trilion parametra. Modeli kryesor Kimi K2.5, i lançuar në janar 2026, ofron aftësi native multimodale, koordinim Agent Swarm dhe performancë në teste që rivalizon GPT-5.2 dhe Claude Opus 4.5. Pavarësisht nëse ju nevojiten përgjigje të shpejta për pyetje të thjeshta, arsyetim i thellë për probleme komplekse ose rrjedha pune med agjentë autonomë, familja e modeleve Kimi mbulon çdo rast përdorimi.
Ekosistemi Kimi ka evoluar me shpejtësi që nga lançimi i K1.5 në janar 2025. Çdo lëshim pasardhës ka zgjeruar aftësitë nga arsyetimi vetëm me tekst në kuptimin e plotë multimodal me video, imazhe dhe dokumente. Të gjitha modelet e serisë K2 ndajnë të njëjtin fundament 1T MoE, por ndryshojnë në të dhënat e trajnimit, grupet e veçorive dhe modalitetet operacionale. Plotësisht modeli K2.5 është me burim të hapur nën një Licencë MIT të Modifikuar, i disponueshëm në Hugging Face për vendosje në serverë privatë.
| Modeli | Data e lançimit | Parametrat | Dritarja e kontekstit | Veçoritë kryesore |
|---|---|---|---|---|
| Kimi K2.5 | Janar 2026 | 1T MoE (32B aktivë) | 256K token | Multimodal nativ, Agent Swarm, burim i hapur |
| Kimi K2-Instruct-0905 | Shtator 2025 | 1T MoE (32B aktivë) | 256K token | Kodim i përmirësuar, kontekst i zgjeruar |
| Kimi K2 | Korrik 2025 | 1T MoE (32B aktivë) | 128K token | Baza e parë 1T MoE, burim i hapur |
| Kimi Linear | Tetor 2025 | 48B MoE (3B aktivë) | 128K token | I lehtë, inferencë efikase |
| Kimi-VL | Prill 2025 | 16B MoE (3B aktivë) | 128K token | Vision-language, multimodal kompakt |
| Kimi K1.5 | Janar 2025 | E papublikuar | 128K token | Arsyetim i barabartë me OpenAI o1 |
Modelet e lehta

Kimi Linear
I prezantuar në tetor 2025, Kimi Linear përdor një arkitekturë kompakte 48B MoE me vetëm 3B parametra të aktivizuar për çdo token. I projektuar për pajisjet fundore dhe mjediset me burime të kufizuara, ai ofron një performancë çuditërisht të lartë në raport me madhësinë e tij. Modeli mbështet 128K token kontekst dhe ekzekutohet me efikasitet në pajisje të nivelit konsumator, duke e bërë atë të përshtatshëm për aplikacione celulare.
Kimi-VL
I lançuar në prill 2025, Kimi-VL është një model vision-language 16B MoE me 3B parametra aktivë. Ai ishte modeli i parë multimodal me burim të hapur nga Moonshot AI, i krijuar për detyra që kombinojnë kuptimin e imazhit me gjenerimin e tekstit. Megjithëse është zëvendësuar nga aftësitë e K2.5 për punë kërkuese, Kimi-VL mbetet i vlefshëm për detyra të lehta vizuale ku modeli i plotë 1T do të ishte i tepërt.
Si të zgjidhni modelin e duhur

Përzgjedhja e modelit varet nga kërkesat tuaja specifike për aftësinë, koston dhe fleksibilitetin e vendosjes. Udhëzuesi i mëposhtëm ndihmon në përshtatjen e rasteve të përdorimit me modelin optimal.
- Përdorni K2.5 përmes API ose faqes zyrtare për inteligjencë artificiale me aftësi maksimale. Modaliteti Instant përpunon detyrat e thjeshta, ndërsa Thinking zgjidh arsyetimet komplekse.
- Zgjidhni modelet K2.5 Agent ose Agent Swarm për rrjedha pune autonome dhe kërkime shkencore. Sistemi Swarm shkëlqen në detyra me shumë hapa që kërkojnë mbledhje paralele informacioni.
- Shkarkoni K2.5 nga Hugging Face për vendosje në serverë lokalë me veçori të plota. Ky model mund të instalohet përmes vLLM, SGLang ose Docker.
- Përdorni Kimi Linear për pajisje me burime të kufizuara hardware-ike. Ky model është ideal për mjedise ku performanca kërkohet në pajisje modeste.
- Zgjidhni Kimi-VL për detyra të thjeshta vizuale me kosto të ulët. Ky model rekomandohet kur aftësitë e plota multimodale të K2.5 tejkalojnë nevojat tuaja aktuale.
- Përdorni K2-Instruct-0905 për arsyetim vetëm me tekst me kosto më të ulët. Ky variant ruan fuqinë e arsyetimit 1T MoE pa përfshirë funksionet e vizionit.



