Přehled modelů Kimi: Od výkonného K2.5 po úsporný Linear

Prozkoumejte špičkovou rodinu AI modelů s architekturou MoE pro uvažování, kódování i nativní multimodalitu.

Přehled modelů Kimi K2.5 Model K2 Lehké modely Kimi K1.5 Jak vybrat model FAQ

Přehled modelů Kimi

Platforma Kimi od společnosti Moonshot AI nabízí působivou řadu modelů AI postavených na architektuře Mixture-of-Experts s jedním bilionem parametrů. Vlajková loď Kimi K2.5, vydaná v lednu 2026, přináší nativní multimodální schopnosti, koordinaci Agent Swarm a výkon v benchmarcích, který konkuruje modelům GPT-5.2 nebo Claude Opus 4.5. Rodina modelů Kimi pokrývá veškeré scénáře použití, ať už potřebujete rychlé odpovědi na jednoduché dotazy, hluboké uvažování pro složité problémy nebo autonomní pracovní postupy agentů.

Ekosystém Kimi se od spuštění modelu K1.5 v lednu 2025 vyvíjel velmi rychle. Každá další verze rozšířila možnosti od čistě textového uvažování až po plné multimodální porozumění videu, obrázkům a dokumentům. Všechny modely řady K2 sdílejí stejný základ 1T MoE, ale liší se tréninkovými daty, sadami funkcí a provozními režimy. Celý model K2.5 je open-source pod modifikovanou licencí MIT a je k dispozici na platformě Hugging Face pro vlastní nasazení.

Model	Datum vydání	Parametry	Kontextové okno	Klíčové funkce
Kimi K2.5	Leden 2026	1T MoE (32B aktivních)	256K tokenů	Nativní multimodalita, Agent Swarm, open-source
Kimi K2-Instruct-0905	Září 2025	1T MoE (32B aktivních)	256K tokenů	Lepší kódování, rozšířený kontext
Kimi K2	Červenec 2025	1T MoE (32B aktivních)	128K tokenů	První 1T MoE, open-source základ
Kimi Linear	Říjen 2025	48B MoE (3B aktivní)	128K tokenů	Lehká váha, efektivní inference
Kimi-VL	Duben 2025	16B MoE (3B aktivní)	128K tokenů	Vizuálně-jazykový model, kompaktní multimodalita
Kimi K1.5	Leden 2025	Nezveřejněno	128K tokenů	Úroveň uvažování srovnatelná s OpenAI o1

Vlajkový model Kimi K2.5

Kimi K2.5 představuje nejschopnější model v řadě, trénovaný na přibližně 15 bilionech smíšených vizuálních a textových tokenů prostřednictvím průběžného předtrénování na základu K2. Architektura využívá 384 expertů, přičemž 8 je aktivováno pro každý token, dále využívá Multi-Latent Attention (MLA) a aktivaci SwiGLU. Nativní multimodální design integruje MoonViT-3D, což je vizuální enkodér s 400 miliony parametrů využívající balení NaViT pro obrazový vstup s variabilním rozlišením.

Čtyři provozní režimy

Model K2.5 pracuje ve čtyřech odlišných režimech, z nichž každý je optimalizován pro jiné pracovní postupy. K2.5 Instant poskytuje rychlé odpovědi bez hlubokého přemýšlení pro přímočaré dotazy. K2.5 Thinking aktivuje řetězec uvažování pro komplexní problémy. Režim K2.5 Agent umožňuje využití nástrojů jedním agentem pro autonomní plnění úkolů. K2.5 Agent Swarm koordinuje až 100 specializovaných podagentů pracujících paralelně, což zkracuje čas provedení až 4,5krát.

Režim	Případ použití	Rychlost	Hloubka uvažování
K2.5 Instant	Rychlé odpovědi, jednoduché úkoly	Nejrychlejší	Standardní
K2.5 Thinking	Matematika, logika, analýza	Střední	Hluboký řetězec uvažování
K2.5 Agent	Použití nástrojů, kód, prohlížení	Dle úkolu	Agentické uvažování
K2.5 Agent Swarm	Komplexní výzkum, složité procesy	4,5x rychlejší než jeden agent	Distribuované multi-agentní

Výkon v benchmarcích

K2.5 dosahuje 96,1 % v testu AIME 2025 (pro srovnání GPT-5.2 má 100 %), 98,0 % v MATH-500 a 87,6 % v GPQA-Diamond. V kódování skóruje 83,1 % v LiveCodeBench v6, čímž výrazně překonává Claude Opus 4.5 s jeho 64,0 %. Režim Agent Swarm dosáhl 50,2 % v Humanity's Last Exam s využitím nástrojů, čímž překonal GPT-5.2 s 45,5 % při o 76 % nižších nákladech. Vizionální schopnosti zahrnují 92,3 % v OCRBench a 86,6 % v VideoMMMU.

Základní model Kimi K2

Model K2, vydaný v červenci 2025, byl prvním modelem MoE s 1 bilionem parametrů od Moonshot AI a základem pro všechny následné verze řady K2. Byl uvolněn jako open-source pod licencí MIT a zavedl architekturu s 384 experty a 32 miliardami aktivních parametrů, kterou dědí i K2.5. Původní verze podporovala kontext 128K tokenů, který byl později v aktualizaci Instruct ze září 2025 rozšířen na 256K.

Verze K2-Instruct-0905 prinesla výrazná zlepšení v programování a rozšířené kontextové okno na 256K tokenů. Tato aktualizace dosáhla 94,5 % v testu HumanEval, což prokazuje silné schopnosti generování kódu. Varianta Instruct zůstává k dispozici jako čistě textová alternativa pro uživatele, kteří nepotřebují multimodální funkce.

Modely lehké váhy

Kimi Linear

Model Kimi Linear, uvedený na trh v říjnu 2025, využívá kompaktní architekturu 48B MoE s pouze 3 miliardami aktivních parametrů na token. Je navržen pro nasazení na koncových zařízeních a v prostředích s omezenými zdroji, přičemž vzhledem ke své velikosti podává překvapivě schopný výkon. Model podporuje kontext 128K tokenů a běží efektivně na běžném spotřebitelském hardwaru, což jej činí vhodným pro lokální nasazení a mobilní aplikace.

Kimi-VL

Kimi-VL, vydaný v dubnu 2025, je vizuálně-jazykový model MoE s 16 miliardami parametrů a 3 miliardami aktivních parametrů. Byl to první multimodální open-source model od Moonshot AI určený pro úkoly kombinující porozumění obrazu s generováním textu. Přestože byl pro náročné pracovní postupy nahrazen nativními schopnostmi K2.5, Kimi-VL zůstává cenným pro lehké vizuální úkoly, kde by byl plný model 1T nadbytečný.

Model pro uvažování Kimi K1.5

Model K1.5, vydaný v lednu 2025, znamenal vstup společnosti Moonshot AI do oblasti pokročilých modelů pro uvažování. Deklaroval výkonnostní paritu s OpenAI o1 v matematických a kódovacích benchmarcích a zavedl do platformy Kimi schopnosti uvažování založené na posilovaném učení. Přestože přesný počet parametrů nebyl nikdy zveřejněn, K1.5 prokázal, že Moonshot AI může konkurovat na špici v oblasti logického uvažování AI.

K1.5 se zaměřoval výhradně na textové uvažování bez multimodálních prvků. Jeho vydání upevnilo pozici Moonshot AI jako vážného konkurenta a připravilo půdu pro výkonnější řadu K2. Uživatelům, kteří stále využívají K1.5, se doporučuje přechod na K2.5, jenž překonává K1.5 ve všech měřitelných parametrech a přidává multimodální a agentické funkce.

Jak vybrat správný model Kimi

Výběr modelu závisí na vašich konkrétních požadavcích na schopnosti, cenu a flexibilitu nasazení. Následující průvodce pomáhá přiřadit scénáře použití k optimální volbě modelu.

Pro univerzální využití AI s maximální kapacitou používejte K2.5 prostřednictvím API nebo webu kimi.com. Režim Instant efektivně zvládá jednoduché úkoly, zatímco režim Thinking řeší složité uvažování.

Pro autonomní pracovní postupy a výzkum zvolte K2.5 Agent nebo režim Agent Swarm. Systém rojů vyniká v vícekrokových úlohách, které vyžadují paralelní sběr informací.

Pro vlastní nasazení s plnými funkcemi stahujte K2.5 z Hugging Face a nasaďte jej pomocí vLLM, SGLang nebo Dockeru. Toto řešení je ideální pro firmy vyžadující kontrolu nad daty.

Pro lehké nebo lokální nasazení využijte Kimi Linear (48B MoE). Je ideální pro prostředí s omezenými zdroji, kde je vyžadována schopná AI na skromnějším hardwaru.

Pro jednoduché vizuální úkoly s nízkým rozpočtem sáhněte po Kimi-VL (16B MoE). Tento model je vhodný v případech, kdy plné multimodální schopnosti K2.5 převyšují vaše potřeby.

Pro čistě textové uvažování při nižších nákladech volte K2-Instruct-0905. Tento model poskytuje sílu 1T MoE v případech, kdy nepotřebujete zpracovávat vizuální data.

Často kladené otázky

Který model Kimi je nejlepší?

Kimi K2.5 je nejschopnější model ve všech metrikách, včetně uvažování, kódování, vidění a agentických úkolů. Dosahuje 96,1 % v AIME 2025 a vévodí v OCRBench s 92,3 %.

Jsou modely Kimi zdarma?

Všechny modely Kimi jsou přístupné zdarma přes kimi.com a aplikace. API je zpoplatněno (např. 0,60 USD za 1M tokenů u K2.5). Open-source váhy na Hugging Face jsou zdarma.

Mohu spustit modely Kimi lokálně?

Ano, modely K2.5 a K2 lze stáhnout z Hugging Face. Pro běžný hardware je však nejvhodnější model Kimi Linear (48B parametry).

Jaký je rozdíl mezi K2 a K2.5?

K2.5 přidává nativní multimodalitu (MoonViT-3D), režim Agent Swarm a vyšší výkon v benchmarcích oproti primárně textovému K2.

Co je to Agent Swarm v K2.5?

Jde o režim koordinující až 100 specializovaných podagentů pracujících paralelně, což zrychluje komplexní výzkumné úkoly až 4,5krát.

Jaké je kontextové okno u Kimi K2.5?

Kimi K2.5 podporuje kontextové okno o velikosti 256K tokenů.