Il modello ammiraglia Kimi K2.5

Kimi K2.5 rappresenta il modello più evoluto della gamma, addestrato su circa 15 trilioni di token misti tra testo e immagini attraverso un pre-addestramento continuo sulla base di K2. L’architettura utilizza 384 esperti con 8 attivati per ogni token, Multi-Latent Attention (MLA) e attivazione SwiGLU. Il design multimodale nativo integra MoonViT-3D, un codificatore visivo da 400 milioni di parametri che utilizza il packing NaViT per gestire input di immagini a risoluzione variabile.
Quattro modalità operative
K2.5 opera in quattro modalità distinte, ottimizzate per diversi flussi di lavoro. K2.5 Instant fornisce risposte rapide senza processi di pensiero per query dirette. K2.5 Thinking attiva il ragionamento chain-of-thought per problemi complessi. K2.5 Agent permette l’uso di strumenti da parte di un singolo agente per il completamento autonomo di compiti. K2.5 Agent Swarm coordina fino a 100 sotto-agenti specializzati che lavorano in parallelo, riducendo i tempi di esecuzione di 4,5 volte.
| Modalità | Caso d’uso | Velocità | Profondità di ragionamento |
|---|---|---|---|
| K2.5 Instant | Risposte rapide, compiti semplici | Massima | Standard |
| K2.5 Thinking | Matematica, logica, analisi complessa | Moderata | Chain-of-thought profonda |
| K2.5 Agent | Uso strumenti, esecuzione codice, browsing | Variabile | Ragionamento agentico |
| K2.5 Agent Swarm | Ricerca complessa, flussi multi-step | 4,5x più veloce dell’agente singolo | Multi-agente distribuito |
Prestazioni nei benchmark
K2.5 raggiunge il 96,1% nel test AIME 2025 (GPT-5.2 ottiene il 100%), il 98,0% su MATH-500 e l'87,6% su GPQA-Diamond. Nel coding, ottiene un punteggio dell'83,1% su LiveCodeBench v6, superando significativamente il 64,0% di Claude Opus 4.5. La modalità Agent Swarm ha raggiunto il 50,2% in Humanity's Last Exam con l'uso di strumenti, superando il 45,5% di GPT-5.2 con costi inferiori del 76%. Le capacità di visione includono il 92,3% su OCRBench e l'86,6% su VideoMMMU.





