Флагманська модель Kimi K2.5

Kimi K2.5 — це найпотужніша модель у лінійці, навчена на приблизно 15 трильйонах змішаних візуальних і текстових токенів шляхом безперервного донавчання на базі K2. Архітектура використовує 384 експерти, з яких 8 активуються для кожного токена, а також механізми Multi-Latent Attention (MLA) та активацію SwiGLU. Нативний мультимодальний дизайн інтегрує MoonViT-3D — візуальний кодер на 400 мільйонів параметрів, що використовує пакування NaViT для обробки зображень із різною роздільною здатністю.
Чотири режими роботи
K2.5 функціонує у чотирьох орієнтованих на різні завдання режимах. Режим K2.5 Instant забезпечує швидкі відповіді без тривалого «обдумування» для простих запитів. Режим K2.5 Thinking активує ланцюжок міркувань (chain-of-thought) для вирішення складних логічних задач. K2.5 Agent дозволяє автономно використовувати інструменти та виконувати програмний код. Нарешті, K2.5 Agent Swarm координує роботу до 100 спеціалізованих субагентів, що діють паралельно, скорочуючи час виконання завдань у 4,5 раза.
| Режим |
Сценарій використання |
Швидкість |
Глибина міркувань |
| K2.5 Instant |
Швидкі відповіді, прості завдання |
Найвища |
Стандартна |
| K2.5 Thinking |
Математика, логіка, складний аналіз |
Середня |
Глибокий ланцюжок думок |
| K2.5 Agent |
Використання інструментів, запуск коду |
Залежить від задачі |
Агентна логіка |
| K2.5 Agent Swarm |
Складні дослідження, багатоетапні процеси |
У 4,5 раза швидше за одного агента |
Розподілений інтелект |
Показники продуктивності
У 2026 році K2.5 демонструє 96,1% у тесті AIME 2025 (показник GPT-5.2 складає 100%), 98,0% на MATH-500 та 87,6% на GPQA-Diamond. У сфері програмування модель отримала 83,1% на LiveCodeBench v6, що значно перевищує результат Claude Opus 4.5 (64,0%). Режим Agent Swarm досяг 50,2% на іспиті Humanity’s Last Exam, випередивши GPT-5.2 з його 45,5% при зниженні витрат на 76%. Візуальні можливості підтверджуються результатами 92,3% на OCRBench та 86,6% на VideoMMMU.