Specifiche tecniche di Kimi

Kimi K2.5 si basa su un'architettura Mixture of Experts (MoE) con 384 esperti, attivandone 8 per ogni token. Il modello utilizza la Multi-Latent Attention (MLA) e l'attivazione SwiGLU, con un addestramento effettuato su circa 15 trilioni di token misti tra testo e immagini. Il design multimodale nativo integra MoonViT-3D, un codificatore visivo da 400 milioni di parametri che utilizza la strategia di compressione NaViT per la gestione di immagini a risoluzione variabile e la comprensione video.
| Specifica | Dettagli |
|---|---|
| Sviluppatore | Moonshot AI |
| Ultimo Modello | Kimi K2.5 (Gennaio 2026) |
| Parametri Totali | 1 trilione (32B attivi per token) |
| Architettura | MoE con 384 esperti, MLA, SwiGLU |
| Finestra di Contesto | 256.000 token (256K) |
| Tipi di Input | Testo, immagini, video, PDF, Excel, Word, PowerPoint |
| Codificatore Visivo | MoonViT-3D (400M parametri) |
| Disponibilità API | API Ufficiale, OpenRouter, Together AI, NVIDIA NIM |
| Prezzo | Gratis (Web/App), 0,60 $/3,00 $ per 1M token (API) |
| Licenza | MIT Modificata (open-source) |
Il modello opera in quattro modalità distinte: K2.5 Instant per risposte rapide, K2.5 Thinking per il ragionamento logico, K2.5 Agent per l'uso di strumenti tramite un singolo agente e K2.5 Agent Swarm (Beta) che coordina fino a 100 sotto-agenti specializzati che lavorano in parallelo. La modalità Agent Swarm riduce i tempi di esecuzione di 4,5 volte e ha ottenuto un punteggio del 50,2% nel benchmark Humanity's Last Exam, superando il 45,5% di GPT-5.2 con un costo inferiore del 76%.
Prestazioni nei benchmark

Kimi K2.5 offre risultati di alto livello nei test di matematica, programmazione e compiti agenziali. Il modello eccelle particolarmente nella programmazione competitiva e nelle attività di ragionamento potenziate da strumenti esterni, affermandosi come un serio concorrente per i migliori modelli proprietari.
| Benchmark | Kimi K2.5 | Miglior Concorrente |
|---|---|---|
| AIME 2025 | 96,1% | GPT-5.2: 100% |
| MATH-500 | 98,0% | Dati non disponibili |
| GPQA-Diamond | 87,6% | GPT-5.2: 92,4% |
| LiveCodeBench v6 | 83,1% | Claude Opus 4.5: 64,0% |
| SWE-Bench Verified | 76,8% | Claude Opus 4.5: 80,9% |
| HLE-Full (con strumenti) | 50,2% | GPT-5.2: 45,5% |
| VideoMMMU | 86,6% | Dati non disponibili |
| OCRBench | 92,3% | Leader di categoria |
Il punteggio di 83,1% su LiveCodeBench rappresenta un vantaggio enorme rispetto al 64,0% di Claude Opus 4.5, rendendo Kimi K2.5 uno dei modelli più potenti per il codice. Su SWE-Bench Verified, che testa compiti di ingegneria del software nel mondo reale, Kimi K2.5 ottiene il 76,8%, mostrando prestazioni competitive in scenari di sviluppo pratico.






