Kimi Modellen: Krachtige AI-oplossingen van K2.5 tot Linear

Verken de kracht van Moonshot AI's vlaggenschipmodellen en open-source innovaties voor elke toepassing.

Overzicht van Kimi modellen Vlaggenschip Kimi K2.5 Basismodel Kimi K2 Efficiënte modellen K1.5 redeneermodel Model kiezen FAQ

Overzicht van Kimi modellen

Het Kimi platform van Moonshot AI biedt een indrukwekkende reeks AI-modellen die zijn gebouwd op een Mixture-of-Experts architectuur met 1 biljoen parameters. Het vlaggenschip, Kimi K2.5, werd uitgebracht in januari 2026. Dit model biedt native multimodale functies, Agent Swarm coördinatie en prestaties die concurreren met GPT-5.2 en Claude Opus 4.5. Of je nu snelle antwoorden zoekt voor eenvoudige vragen of diepgaande redeneringen voor complexe problemen, de Kimi modellenreeks dekt elke situatie.

Sinds de lancering van K1.5 in januari 2025 is het ecosysteem snel gegroeid. Elke nieuwe release breidde de mogelijkheden uit van tekst naar een volledig begrip van video, afbeeldingen en documenten. Alle modellen in de K2-serie delen dezelfde basis van 1 biljoen parameters, maar verschillen in trainingsgegevens en functies. Het volledige K2.5 model is open-source onder een aangepaste MIT-licentie en is beschikbaar op Hugging Face voor lokale implementatie.

Model	Releasedatum	Parameters	Contextvenster	Belangrijkste kenmerken
Kimi K2.5	Januari 2026	1T MoE (32B actief)	256K tokens	Native multimedia, Agent Swarm, open-source
Kimi K2-Instruct-0905	September 2025	1T MoE (32B actief)	256K tokens	Verbeterde codering, uitgebreide context
Kimi K2	Juli 2025	1T MoE (32B actief)	128K tokens	Eerste 1T MoE, open-source basis
Kimi Linear	Oktober 2025	48B MoE (3B actief)	128K tokens	Lichtgewicht, efficiënte verwerking
Kimi-VL	April 2025	16B MoE (3B actief)	128K tokens	Beeldverwerking, compacte multimedia
Kimi K1.5	Januari 2025	Niet bekend	128K tokens	Redeneren op het niveau van OpenAI o1

Vlaggenschip model Kimi K2.5

Kimi K2.5 is het meest geavanceerde model in de reeks. Het is getraind op ongeveer 15 biljoen tokens bestaande uit tekst en beeldmateriaal. De architectuur maakt gebruik van 384 experts, waarvan er 8 per token worden geactiveerd. Het systeem gebruikt Multi-Latent Attention en SwiGLU activatie voor optimale efficiëntie. Voor visuele taken bevat het model MoonViT-3D, een encoder die afbeeldingen met verschillende resoluties kan verwerken.

Vier verschillende gebruiksmodi

K2.5 werkt in vier specifieke modi die zijn geoptimaliseerd voor verschillende werkstromen. De Instant modus geeft direct antwoord op simpele vragen zonder uitgebreid denkproces. De Thinking modus activeert stapsgewijs redeneren voor complexe vraagstukken. Voor autonome taken is er de Agent modus, terwijl de Agent Swarm modus tot wel 100 gespecialiseerde sub-agenten parallel laat samenwerken. Dit versnelt de uitvoering van complexe projecten aanzienlijk.

Modus	Toepassing	Snelheid	Denkniveau
K2.5 Instant	Snel antwoord, simpele taken	Snelst	Standaard
K2.5 Thinking	Wiskunde, logica, analyse	Gemiddeld	Diepgaand redeneren
K2.5 Agent	Tools gebruiken, code draaien	Variabel	Taakgericht redeneren
K2.5 Agent Swarm	Complex onderzoek, workflow	Zeer snel bij grote taken	Gedistribueerd systeem

Prestaties en benchmarks

In tests behaalt K2.5 een score van 96,1% op AIME 2025 en 87,6% op GPQA-Diamond. Op het gebied van programmeren scoort het model 83,1% op LiveCodeBench v6, wat ruim boven de 64,0% van Claude Opus 4.5 ligt. De Agent Swarm modus presteerde uitstekend bij wetenschappelijke tests met een score van 50,2%. Visuele capaciteiten zijn ook sterk aanwezig met een score van 92,3% op OCRBench voor tekstherkenning in afbeeldingen.

Basismodel Kimi K2

K2 werd gelanceerd in juli 2025 als het eerste MoE-model van Moonshot AI met 1 biljoen parameters. Het vormde de fundering voor alle latere ontwikkelingen in de K2-serie. Het model werd open-source beschikbaar gesteld onder de MIT-licentie. Waar de eerste versie 128K tokens aan context ondersteunde, werd dit in september 2025 uitgebreid naar 256K tokens via een belangrijke update.

De K2-Instruct-0905 versie bracht aanzienlijke verbeteringen voor ontwikkelaars. Met een score van 94,5% op HumanEval bewees dit model zijn kracht bij het genereren van programmeercode. Deze variant blijft een populair alternatief voor gebruikers die enkel tekstverwerking nodig hebben en geen multimodale functies vereisen.

Efficiënte lichtgewicht modellen

Kimi Linear

Kimi Linear verscheen in oktober 2025 en is gebouwd op een compacte architectuur van 48B parameters. Het model is speciaal ontworpen voor gebruik op lokale apparaten en omgevingen met beperkte rekenkracht. Ondanks de kleinere omvang levert het zeer respectabele prestaties. Het is ideaal voor mobiele applicaties en scenario's waarbij een lage reactietijd belangrijker is dan maximale rekenkracht.

Kimi-VL

Dit model uit april 2025 richt zich specifiek op de combinatie van tekst en beeld. Met 16B parameters was het de eerste stap van Moonshot AI naar multimodale open-source software. Hoewel K2.5 inmiddels krachtiger is voor visuele taken, blijft Kimi-VL een waardevolle optie voor simpele beeldanalyse waarbij het gebruik van een gigantisch model niet efficiënt zou zijn.

Het K1.5 redeneermodel

In januari 2025 zette Moonshot AI zichzelf op de kaart met K1.5. Dit model was gericht op geavanceerd redeneren en evenaarde de prestaties van OpenAI o1 in wiskunde- en programmeertests. Het introduceerde technieken zoals reinforcement learning om denkprocessen te verbeteren. Hoewel het enkel tekst ondersteunde, legde het de basis voor de huidige K2-serie.

Gebruikers die nog steeds met K1.5 werken, wordt aangeraden over te stappen naar K2.5. De nieuwere versie presteert op alle vlakken beter en voegt daarnaast ondersteuning voor beelden en agenten toe. K1.5 blijft echter een historisch belangrijk punt in de ontwikkeling van Europese en wereldwijde AI-systemen.

Het juiste model kiezen

De keuze voor een specifiek model hangt af van je budget, de gewenste rekenkracht en de manier waarop je de software wilt draaien. Gebruik de volgende richtlijnen voor je selectie.

Gebruik K2.5 via de API voor algemene AI-taken van het hoogste niveau.
Kies voor K2.5 Agent of Agent Swarm bij complexe onderzoeken die parallelle verwerking vereisen.
Download K2.5 via Hugging Face als je het model op eigen servers wilt draaien met volledige controle.
Selecteer Kimi Linear voor lokale installaties op consumentenhardware waar snelheid cruciaal is.
Gebruik Kimi-VL voor eenvoudige visuele taken met een beperkt budget voor rekenkracht.
Kies K2-Instruct-0905 als je alleen krachtige tekstverwerking nodig hebt zonder visuele extra's.

Veelgestelde vragen

Welk Kimi model is het beste?

Kimi K2.5 is momenteel het krachtigste model voor bijna alle taken. Het is de marktleider op het gebied van redeneren, programmeren en beeldherkenning. Voor gebruikers die minder rekenkracht nodig hebben, biedt Kimi Linear een uitstekende balans tussen prestaties en kosten.

Zijn Kimi modellen gratis?

Je kunt de modellen gratis gebruiken via de officiële website en mobiele apps. Voor zakelijk gebruik via de API geldt een betaling per token. Momenteel, in 2026, beginnen de prijzen voor K2.5 bij ongeveer $0,60 per miljoen input tokens. De broncode en parameters op Hugging Face zijn gratis te downloaden voor eigen gebruik.

Kan ik Kimi lokaal draaien?

Ja, de K2 en K2.5 modellen zijn beschikbaar op Hugging Face en kunnen worden gebruikt met software zoals vLLM of Docker. Houd er rekening mee dat het volledige 1T model zeer krachtige hardware vereist. Kimi Linear is veel toegankelijker voor normale computersystemen.

Wat is het verschil tussen K2 en K2.5?

K2.5 voegt volledige ondersteuning voor beelden en video toe via de MoonViT-3D encoder. Ook introduceert het de Agent Swarm modus voor complexer werk. Waar de oorspronkelijke K2 vooral een tekstmodel was met een kleiner contextvenster, is K2.5 een universele assistent die ook documenten en multimedia verwerkt.

Hoeveel parameters heeft Kimi K2.5?

Kimi K2.5 maakt gebruik van een Mixture-of-Experts architectuur met in totaal 1 biljoen (1T) parameters, waarvan er 32B per token actief zijn.

Is Kimi K2.5 open-source?

Ja, het volledige K2.5 model is open-source onder een aangepaste MIT-licentie en is beschikbaar op Hugging Face voor lokale implementatie.

Wat is Agent Swarm?

Agent Swarm is een modus in K2.5 waarbij tot 100 gespecialiseerde sub-agenten parallel samenwerken om complexe projecten en onderzoeken uit te voeren.

Wat is het contextvenster van K2.5?

Kimi K2.5 ondersteunt een contextvenster tot 256K tokens.