Kimi AI: El modelo K2.5 con arquitectura MoE y Agent Swarm

Explora el poder de la IA de 1 billón de parámetros con visión nativa y el revolucionario sistema Agent Swarm para máxima eficiencia.

Prueba Kimi Ahora

Especificaciones Benchmarks Capacidades Casos de uso API y Precios Acceso Ventajas y Limitaciones FAQ

Especificaciones principales de Kimi

Kimi K2.5 se ejecuta en una arquitectura MoE con 384 expertos, activando 8 por cada token. El modelo utiliza Atención de Latencia Múltiple (MLA) y activación SwiGLU, tras haber sido entrenado con aproximadamente 15 billones de tokens mixtos de texto y visión. El diseño multimodal nativo integra MoonViT-3D, un codificador de visión de 400 millones de parámetros que utiliza la estrategia de empaquetado NaViT para procesar imágenes de resolución variable y comprensión de video.

Especificación	Detalles
Desarrollador	Moonshot AI
Último modelo	Kimi K2.5 (Enero 2026)
Parámetros totales	1 billón (32B activos por token)
Arquitectura	MoE con 384 expertos (8 activos), MLA, SwiGLU
Ventana de contexto	256.000 tokens (256K)
Tipos de entrada	Texto, imágenes, video, PDF, Excel, Word, PowerPoint
Codificador de visión	MoonViT-3D (400M parámetros, NaViT)
Disponibilidad de API	API oficial, OpenRouter, Together AI, NVIDIA NIM
Precio	Gratis (Web/App), 0,60 $/3,00 $ por 1M tokens (API)
Licencia	MIT Modificada (Código abierto, uso comercial permitido)

El modelo opera en cuatro modos distintos: K2.5 Instant para respuestas rápidas sin razonamiento profundo, K2.5 Thinking para razonamiento de cadena de pensamiento, K2.5 Agent para el uso de herramientas por un solo agente y K2.5 Agent Swarm (Beta), que coordina hasta 100 subagentes especializados trabajando en paralelo. El modo Agent Swarm reduce el tiempo de ejecución en 4,5 veces y logró un 50,2 % en el examen Humanity's Last Exam, superando el 45,5 % de GPT-5.2 con un coste un 76 % menor.

Rendimiento en pruebas comparativas

Kimi K2.5 ofrece resultados de primer nivel en matemáticas, programación y evaluaciones de agentes. El modelo destaca especialmente en programación competitiva y tareas de razonamiento aumentadas con herramientas, estableciéndose como un competidor serio frente a los mejores modelos de código cerrado.

Benchmark	Kimi K2.5	Mejor competidor
AIME 2025	96,1 %	GPT-5.2: 100 %
MATH-500	98,0 %	N/A
GPQA-Diamond	87,6 %	GPT-5.2: 92,4 %
LiveCodeBench v6	83,1 %	Claude Opus 4.5: 64,0 %
SWE-Bench Verified	76,8 %	Claude Opus 4.5: 80,9 %
HLE-Full (con herramientas)	50,2 %	GPT-5.2: 45,5 %
VideoMMMU	86,6 %	N/A
OCRBench	92,3 %	Líder actual

La puntuación de 83,1 % en LiveCodeBench representa una ventaja masiva sobre el 64,0 % de Claude Opus 4.5, convirtiendo a Kimi K2.5 en uno de los modelos de programación más potentes. En SWE-Bench Verified, que evalúa tareas reales de ingeniería de software, Kimi K2.5 alcanza un 76,8 % frente al 80,9 % de Claude Opus 4.5, demostrando un rendimiento competitivo en escenarios de desarrollo prácticos.

Capacidades avanzadas de Kimi

Las funciones de Kimi K2.5 se extienden mucho más allá de las interacciones estándar de un chatbot hacia la comprensión multimodal, la automatización mediante agentes y el procesamiento especializado de documentos. La arquitectura de visión nativa procesa imágenes y video sin módulos externos, mientras que el sistema Agent Swarm gestiona tareas complejas de múltiples pasos de forma autónoma.

Comprensión multimodal nativa

A diferencia de los sistemas de visión añadidos posteriormente, Kimi K2.5 procesa la información visual de forma nativa mediante su codificador MoonViT-3D. El sistema maneja imágenes de resolución variable, documentos con diseños complejos y contenido de video donde los fotogramas consecutivos se agrupan de cuatro en cuatro, se procesan mediante capas de visión compartidas y se promedian temporalmente. Esta arquitectura obtiene un 92,3 % en OCRBench y un 92,6 % en InfoVQA, liderando las tareas de comprensión de documentos. Las aplicaciones prácticas incluyen el análisis de gráficos, la extracción de datos de documentos escaneados y la interpretación de diagramas técnicos.

Sistema de enjambre de agentes

El modo Agent Swarm representa la característica más innovadora de Kimi K2.5. Coordina hasta 100 subagentes especializados que trabajan en paralelo en diferentes aspectos de una tarea compleja. Cada subagente se encarga de una subtarea específica y el sistema sintetiza sus resultados en una respuesta coherente. Este enfoque logró un 78,4 % en BrowseComp con el enjambre frente al 60,6 % sin él, demostrando mejoras significativas. El sistema es eficaz para tareas de investigación que requieren recopilar información de múltiples fuentes y flujos de trabajo que se benefician de la ejecución paralela.

Análisis de documentos de contexto largo

Con una ventana de contexto de 256K tokens, Kimi K2.5 procesa extensos documentos, bases de código y artículos científicos en una sola sesión. La plataforma acepta múltiples archivos simultáneamente, manejando tamaños combinados que superan la capacidad de la mayoría de las herramientas empresariales. Los profesionales legales utilizan Kimi para comparar versiones de contratos e identificar discrepancias entre cláusulas. La arquitectura MoE mantiene la precisión en todo el rango de contexto sin la degradación típica de los modelos transformadores densos en longitudes de entrada extremas.

Casos de uso práctico para Kimi

Las aplicaciones en el mundo real demuestran las ventajas de Kimi K2.5 en escenarios donde la comprensión multimodal, la capacidad de los agentes y la retención del contexto afectan directamente a la calidad del resultado.

Investigación y análisis: el modo Agent Swarm permite realizar investigaciones exhaustivas asignando subagentes para recopilar información de diversas fuentes. Los investigadores pueden introducir de 20 a 30 artículos a la vez para sintetizar metodologías o comparar resultados experimentales con atribución completa de fuentes.
Procesamiento de documentos y OCR: con puntuaciones líderes en OCRBench, Kimi K2.5 destaca en la extracción de datos estructurados de facturas, recibos y notas escritas a mano. La arquitectura nativa maneja diseños complejos que incluyen tablas y gráficos mezclados con texto.
Desarrollo de software: los equipos de desarrollo cargan bases de código completas para realizar depuración autónoma, revisión de código e implementación de funciones. El rendimiento en SWE-Bench demuestra su capacidad para comprender estructuras de repositorios reales y realizar cambios pertinentes.
Comprensión de video: el codificador MoonViT-3D permite analizar videos de tutoriales, extraer momentos clave de presentaciones y generar resúmenes de reuniones grabadas. Su puntuación en VideoMMMU refleja una sólida comprensión temporal.

API de Kimi y precios

La interfaz web y las aplicaciones móviles permanecen gratuitas en 2026. Los desarrolladores que creen aplicaciones de producción pueden acceder a Kimi K2.5 a través de la API oficial o proveedores externos como OpenRouter y Together AI.

Proveedor	Entrada (por 1M tokens)	Salida (por 1M tokens)	Notas
Moonshot Oficial	0,60 $	3,00 $	Caché de contexto automático (75 % de descuento)
OpenRouter	0,45 $	2,20 $	Precios agregados
Together AI	0,50 $	2,80 $	Inferencia optimizada

El almacenamiento en caché automático de contexto en la API oficial reduce los costes de entrada en un 75 %, bajando el precio de los tokens almacenados en caché a 0,15 $ por millón de tokens. Actualmente, esto hace que Kimi K2.5 sea considerablemente más económico que sus competidores directos para tareas equivalentes. La API mantiene la compatibilidad con el formato del SDK de OpenAI, requiriendo solo cambios en la URL base y la clave API.

Los límites de velocidad escalan por niveles: el Nivel 1 permite 50 solicitudes concurrentes, mientras que el Nivel 5 permite hasta 1.000 solicitudes concurrentes y 10.000 solicitudes por minuto. La ventana de contexto admite hasta 262.144 tokens por solicitud. El modelo de código abierto está disponible en Hugging Face para despliegues personalizados mediante vLLM o Docker.

Cómo acceder a Kimi AI

Los nuevos usuarios pueden acceder a Kimi a través de su sitio web o mediante aplicaciones móviles para iOS y Android. No se requiere verificación telefónica para el acceso básico.

Visita la página oficial o descarga la aplicación de la App Store o Google Play. La aplicación suele aparecer como «Kimi -- Now with K2.5».
Crea una cuenta utilizando un correo electrónico o inicio de sesión social. La interfaz web proporciona acceso inmediato a los modos Instant, Thinking y Agent.
Para el acceso a la API, regístrate en el portal de desarrolladores de Moonshot AI y genera una clave de API. La documentación está disponible en inglés y chino.
Para el auto-alojamiento, descarga el modelo de Hugging Face en formato block-fp8 y despliégalo mediante vLLM, SGLang o Transformers.

Los desarrolladores que integren Kimi en sus aplicaciones pueden utilizar la biblioteca estándar de OpenAI con el siguiente ejemplo:

from openai import OpenAI

client = OpenAI(
    api_key="tu_clave_api_moonshot",
    base_url="https://api.moonshot.cn/v1"
)

response = client.chat.completions.create(
    model="kimi-k2.5",
    messages=[
        {"role": "system", "content": "Eres un asistente útil."},
        {"role": "user", "content": "Analiza el documento subido."}
    ],
    temperature=0.7
)

print(response.choices[0].message.content)

Esta estructura de código funciona de forma idéntica a las llamadas de la API de OpenAI, requiriendo únicamente el cambio del parámetro base_url. El manejo de errores y la lógica de reintentos existentes se transfieren sin modificaciones. La API también admite respuestas en streaming y llamadas a funciones para flujos de trabajo de agentes.

Ventajas y limitaciones de Kimi

Ventajas	Limitaciones
Modelo de 1T parámetros de código abierto para uso comercial bajo Licencia MIT Modificada	La puntuación en SWE-Bench (76,8 %) es inferior a la de Claude Opus 4.5 (80,9 %)
Arquitectura multimodal nativa con puntuaciones líderes en OCR y análisis de documentos	Razonamiento matemático puro ligeramente por detrás de GPT-5.2 (96,1 % frente a 100 %)
El sistema Agent Swarm coordina 100 subagentes, superando a GPT-5.2 en HLE	Agent Swarm continúa en fase beta con posible inestabilidad en flujos complejos
Aproximadamente 4 veces más barato que Claude Opus 4.5 con caché de contexto	El despliegue local requiere recursos de GPU significativos para un modelo de 1T

FAQ

¿Es Kimi AI gratuito?

La interfaz web y las aplicaciones móviles son gratuitas para todos los usuarios en 2026, sin necesidad de suscripción para interacciones estándar en todos sus modos. El acceso a la API es de pago por token, empezando en 0,60 $ por millón de tokens de entrada. El modelo de código abierto en Hugging Face se puede descargar y desplegar sin coste de licencia.

¿Cómo se compara Kimi con ChatGPT?

Kimi K2.5 compite directamente con GPT-5.2. Kimi lidera en LiveCodeBench y en la evaluación HLE-Full con herramientas, ofreciendo además precios de API significativamente más bajos. GPT-5.2 mantiene la ventaja en matemáticas puras y GPQA-Diamond. La disponibilidad de código abierto de Kimi y su sistema Agent Swarm ofrecen ventajas únicas para desarrolladores.

¿Es Kimi de código abierto?

Sí, Kimi K2.5 es totalmente de código abierto bajo una Licencia MIT Modificada, lo que permite su uso comercial, modificación y redistribución. Los pesos del modelo están disponibles en Hugging Face en formato block-fp8, lo que lo convierte en uno de los modelos de IA abiertos más capaces del mercado actual.

¿Qué es el Agent Swarm de Kimi?

Agent Swarm es una función en fase beta que coordina hasta 100 subagentes trabajando simultáneamente. Cada uno se enfoca en una parte específica de un problema complejo y el sistema une las soluciones al final. Este método ha demostrado reducir el tiempo de ejecución en un 450 % y los costes en un 76 % en comparación con el uso de un solo agente.

¿Qué ventana de contexto tiene Kimi K2.5?

Ofrece una ventana de contexto de 256.000 tokens (256K), ideal para procesar extensos documentos, bases de código y artículos científicos en una sola sesión.

¿Dónde puedo descargar la aplicación de Kimi?

Está disponible oficialmente en la App Store para iOS y en Google Play para Android, generalmente bajo el nombre «Kimi -- Now with K2.5».

¿Qué formatos de archivo admite Kimi?

Admite una amplia gama de formatos, incluyendo Texto, imágenes, video, PDF, Excel, Word y PowerPoint.

¿Es compatible Kimi con el SDK de OpenAI?

Sí, la API de Kimi mantiene la compatibilidad con el formato del SDK de OpenAI, requiriendo únicamente el cambio de la URL base y la clave API.