Il modello ammiraglia Kimi K2.5

Il modello ammiraglia Kimi K2.5

Kimi K2.5 rappresenta il modello più evoluto della gamma, addestrato su circa 15 trilioni di token misti tra testo e immagini attraverso un pre-addestramento continuo sulla base di K2. L’architettura utilizza 384 esperti con 8 attivati per ogni token, Multi-Latent Attention (MLA) e attivazione SwiGLU. Il design multimodale nativo integra MoonViT-3D, un codificatore visivo da 400 milioni di parametri che utilizza il packing NaViT per gestire input di immagini a risoluzione variabile.

Quattro modalità operative

K2.5 opera in quattro modalità distinte, ottimizzate per diversi flussi di lavoro. K2.5 Instant fornisce risposte rapide senza processi di pensiero per query dirette. K2.5 Thinking attiva il ragionamento chain-of-thought per problemi complessi. K2.5 Agent permette l’uso di strumenti da parte di un singolo agente per il completamento autonomo di compiti. K2.5 Agent Swarm coordina fino a 100 sotto-agenti specializzati che lavorano in parallelo, riducendo i tempi di esecuzione di 4,5 volte.

Modalità Caso d’uso Velocità Profondità di ragionamento
K2.5 Instant Risposte rapide, compiti semplici Massima Standard
K2.5 Thinking Matematica, logica, analisi complessa Moderata Chain-of-thought profonda
K2.5 Agent Uso strumenti, esecuzione codice, browsing Variabile Ragionamento agentico
K2.5 Agent Swarm Ricerca complessa, flussi multi-step 4,5x più veloce dell’agente singolo Multi-agente distribuito

Prestazioni nei benchmark

K2.5 raggiunge il 96,1% nel test AIME 2025 (GPT-5.2 ottiene il 100%), il 98,0% su MATH-500 e l'87,6% su GPQA-Diamond. Nel coding, ottiene un punteggio dell'83,1% su LiveCodeBench v6, superando significativamente il 64,0% di Claude Opus 4.5. La modalità Agent Swarm ha raggiunto il 50,2% in Humanity's Last Exam con l'uso di strumenti, superando il 45,5% di GPT-5.2 con costi inferiori del 76%. Le capacità di visione includono il 92,3% su OCRBench e l'86,6% su VideoMMMU.