Kimi AI App Try Now

Přehled modelů Kimi: Od výkonného K2.5 po úsporný Linear

Prozkoumejte špičkovou rodinu AI modelů s architekturou MoE pro uvažování, kódování i nativní multimodalitu.

Vyzkoušet Kimi AI

Přehled modelů Kimi

Přehled modelů Kimi

Platforma Kimi od společnosti Moonshot AI nabízí působivou řadu modelů AI postavených na architektuře Mixture-of-Experts s jedním bilionem parametrů. Vlajková loď Kimi K2.5, vydaná v lednu 2026, přináší nativní multimodální schopnosti, koordinaci Agent Swarm a výkon v benchmarcích, který konkuruje modelům GPT-5.2 nebo Claude Opus 4.5. Rodina modelů Kimi pokrývá veškeré scénáře použití, ať už potřebujete rychlé odpovědi na jednoduché dotazy, hluboké uvažování pro složité problémy nebo autonomní pracovní postupy agentů.

Ekosystém Kimi se od spuštění modelu K1.5 v lednu 2025 vyvíjel velmi rychle. Každá další verze rozšířila možnosti od čistě textového uvažování až po plné multimodální porozumění videu, obrázkům a dokumentům. Všechny modely řady K2 sdílejí stejný základ 1T MoE, ale liší se tréninkovými daty, sadami funkcí a provozními režimy. Celý model K2.5 je open-source pod modifikovanou licencí MIT a je k dispozici na platformě Hugging Face pro vlastní nasazení.

Model Datum vydání Parametry Kontextové okno Klíčové funkce
Kimi K2.5 Leden 2026 1T MoE (32B aktivních) 256K tokenů Nativní multimodalita, Agent Swarm, open-source
Kimi K2-Instruct-0905 Září 2025 1T MoE (32B aktivních) 256K tokenů Lepší kódování, rozšířený kontext
Kimi K2 Červenec 2025 1T MoE (32B aktivních) 128K tokenů První 1T MoE, open-source základ
Kimi Linear Říjen 2025 48B MoE (3B aktivní) 128K tokenů Lehká váha, efektivní inference
Kimi-VL Duben 2025 16B MoE (3B aktivní) 128K tokenů Vizuálně-jazykový model, kompaktní multimodalita
Kimi K1.5 Leden 2025 Nezveřejněno 128K tokenů Úroveň uvažování srovnatelná s OpenAI o1

Základní model Kimi K2

Základní model Kimi K2

Model K2, vydaný v červenci 2025, byl prvním modelem MoE s 1 bilionem parametrů od Moonshot AI a základem pro všechny následné verze řady K2. Byl uvolněn jako open-source pod licencí MIT a zavedl architekturu s 384 experty a 32 miliardami aktivních parametrů, kterou dědí i K2.5. Původní verze podporovala kontext 128K tokenů, který byl později v aktualizaci Instruct ze září 2025 rozšířen na 256K.

Verze K2-Instruct-0905 prinesla výrazná zlepšení v programování a rozšířené kontextové okno na 256K tokenů. Tato aktualizace dosáhla 94,5 % v testu HumanEval, což prokazuje silné schopnosti generování kódu. Varianta Instruct zůstává k dispozici jako čistě textová alternativa pro uživatele, kteří nepotřebují multimodální funkce.

Model pro uvažování Kimi K1.5

Model pro uvažování Kimi K1.5

Model K1.5, vydaný v lednu 2025, znamenal vstup společnosti Moonshot AI do oblasti pokročilých modelů pro uvažování. Deklaroval výkonnostní paritu s OpenAI o1 v matematických a kódovacích benchmarcích a zavedl do platformy Kimi schopnosti uvažování založené na posilovaném učení. Přestože přesný počet parametrů nebyl nikdy zveřejněn, K1.5 prokázal, že Moonshot AI může konkurovat na špici v oblasti logického uvažování AI.

K1.5 se zaměřoval výhradně na textové uvažování bez multimodálních prvků. Jeho vydání upevnilo pozici Moonshot AI jako vážného konkurenta a připravilo půdu pro výkonnější řadu K2. Uživatelům, kteří stále využívají K1.5, se doporučuje přechod na K2.5, jenž překonává K1.5 ve všech měřitelných parametrech a přidává multimodální a agentické funkce.

Jak vybrat správný model Kimi

Jak vybrat správný model Kimi

Výběr modelu závisí na vašich konkrétních požadavcích na schopnosti, cenu a flexibilitu nasazení. Následující průvodce pomáhá přiřadit scénáře použití k optimální volbě modelu.

Pro univerzální využití AI s maximální kapacitou používejte K2.5 prostřednictvím API nebo webu kimi.com. Režim Instant efektivně zvládá jednoduché úkoly, zatímco režim Thinking řeší složité uvažování.

Pro autonomní pracovní postupy a výzkum zvolte K2.5 Agent nebo režim Agent Swarm. Systém rojů vyniká v vícekrokových úlohách, které vyžadují paralelní sběr informací.

Pro vlastní nasazení s plnými funkcemi stahujte K2.5 z Hugging Face a nasaďte jej pomocí vLLM, SGLang nebo Dockeru. Toto řešení je ideální pro firmy vyžadující kontrolu nad daty.

Pro lehké nebo lokální nasazení využijte Kimi Linear (48B MoE). Je ideální pro prostředí s omezenými zdroji, kde je vyžadována schopná AI na skromnějším hardwaru.

Pro jednoduché vizuální úkoly s nízkým rozpočtem sáhněte po Kimi-VL (16B MoE). Tento model je vhodný v případech, kdy plné multimodální schopnosti K2.5 převyšují vaše potřeby.

Pro čistě textové uvažování při nižších nákladech volte K2-Instruct-0905. Tento model poskytuje sílu 1T MoE v případech, kdy nepotřebujete zpracovávat vizuální data.

Často kladené otázky

Který model Kimi je nejlepší?

Kimi K2.5 je nejschopnější model ve všech metrikách, včetně uvažování, kódování, vidění a agentických úkolů. Dosahuje 96,1 % v AIME 2025 a vévodí v OCRBench s 92,3 %.

Jsou modely Kimi zdarma?

Všechny modely Kimi jsou přístupné zdarma přes kimi.com a aplikace. API je zpoplatněno (např. 0,60 USD za 1M tokenů u K2.5). Open-source váhy na Hugging Face jsou zdarma.

Mohu spustit modely Kimi lokálně?

Ano, modely K2.5 a K2 lze stáhnout z Hugging Face. Pro běžný hardware je však nejvhodnější model Kimi Linear (48B parametry).

Jaký je rozdíl mezi K2 a K2.5?

K2.5 přidává nativní multimodalitu (MoonViT-3D), režim Agent Swarm a vyšší výkon v benchmarcích oproti primárně textovému K2.

Co je to Agent Swarm v K2.5?

Jde o režim koordinující až 100 specializovaných podagentů pracujících paralelně, což zrychluje komplexní výzkumné úkoly až 4,5krát.

Jaké je kontextové okno u Kimi K2.5?

Kimi K2.5 podporuje kontextové okno o velikosti 256K tokenů.