Modelul reprezentativ Kimi K2.5

Kimi K2.5 reprezintă cel mai avansat model din gamă, fiind antrenat pe aproximativ 15 trilioane de tokeni micști vizuali și textuali prin pre-antrenare continuă pe baza K2. Arhitectura utilizează 384 de experți, dintre care 8 sunt activați per token, folosind Multi-Latent Attention (MLA) și activare SwiGLU. Designul multimodal nativ integrează MoonViT-3D, un codificator vizual de 400M parametri care utilizează tehnologia NaViT pentru procesarea imaginilor cu rezoluție variabilă.
Patru moduri operaționale distincte
K2.5 funcționează în patru moduri diferite, fiecare fiind optimizat pentru fluxuri de lucru specifice. K2.5 Instant oferă răspunsuri rapide fără procesare complexă pentru întrebări directe. K2.5 Thinking activează raționamentul de tip lanț de gândire pentru probleme logice. K2.5 Agent permite utilizarea instrumentelor externe pentru finalizarea autonomă a sarcinilor. K2.5 Agent Swarm coordonează până la 100 de sub-agenți specializați care lucrează în paralel, reducând timpul de execuție de 4,5 ori.
| Mod | Caz de utilizare | Viteză | Profunzimea raționamentului |
|---|---|---|---|
| K2.5 Instant | Răspunsuri rapide, sarcini simple | Cea mai rapidă | Standard |
| K2.5 Thinking | Matematică, logică, analiză | Moderată | Lanț de gândire profund |
| K2.5 Agent | Execuție cod, navigare web | Depinde de sarcină | Raționament agenic |
| K2.5 Agent Swarm | Cercetare complexă, fluxuri multiple | De 4,5 ori mai rapid | Multi-agent distribuit |
Performanțe în teste de referință
K2.5 atinge un scor de 96,1% la testul AIME 2025 (GPT-5.2 având 100%), 98,0% la MATH-500 și 87,6% la GPQA-Diamond. În domeniul programării, acesta obține 83,1% pe LiveCodeBench v6, depășind semnificativ scorul de 64,0% al modelului Claude Opus 4.5. Modul Agent Swarm a obținut 50,2% la Humanity's Last Exam folosind instrumente externe, surclasând scorul de 45,5% al GPT-5.2 cu un cost cu 76% mai mic. Capacitățile vizuale includ 92,3% pe OCRBench și 86,6% pe VideoMMMU.





