Kimi AI App Try Now

Kimi Modelle im Vergleich

Entdecken Sie die Zukunft der KI mit der Kimi K2.5 Serie – native Multimodalität und Agent Swarm Technologie vereint.

Jetzt entdecken

Übersicht über die Kimi Modelle

Übersicht über die Kimi Modelle

Die Kimi Plattform von Moonshot AI bietet eine beeindruckende Auswahl an KI-Modellen, die auf einer Mixture-of-Experts-Architektur mit 1 Billion Parametern basieren. Das Flaggschiff Kimi K2.5, das im Januar 2026 veröffentlicht wurde, liefert native multimodale Fähigkeiten, Agent Swarm Koordination und eine Benchmark-Leistung, die mit GPT-5.2 und Claude Opus 4.5 конкуriert. Ob Sie schnelle Antworten für einfache Anfragen, tiefgreifende logische Analysen für komplexe Probleme oder autonome Agenten-Workflows benötigen, die Kimi Modellfamilie deckt jeden Anwendungsfall ab.

Das Ökosystem von Kimi hat sich seit dem Start von K1.5 im Januar 2025 rasant entwickelt. Jede nachfolgende Veröffentlichung hat die Funktionen von reiner Textverarbeitung auf ein vollständiges multimodales Verständnis von Videos, Bildern und Dokumenten erweitert. Alle Modelle der K2-Serie teilen die gleiche Basis von 1 Billion Parametern (1T MoE), unterscheiden sich jedoch in den Trainingsdaten, dem Funktionsumfang und den Betriebsmodi. Das gesamte K2.5 Modell ist unter einer modifizierten MIT-Lizenz quelloffen und auf Hugging Face für die selbst gehostete Bereitstellung verfügbar.

Modell Veröffentlichungsdatum Parameter Kontextfenster Hauptmerkmale
Kimi K2.5 Januar 2026 1T MoE (32B aktiv) 256K Token Nativ multimodal, Agent Swarm, Open-Source
Kimi K2-Instruct-0905 September 2025 1T MoE (32B aktiv) 256K Token Verbesserte Programmierung, erweiterter Kontext
Kimi K2 Juli 2025 1T MoE (32B aktiv) 128K Token Erstes 1T MoE, quelloffene Basis
Kimi Linear Oktober 2025 48B MoE (3B aktiv) 128K Token Leichtgewichtig, effiziente Inferenz
Kimi-VL April 2025 16B MoE (3B aktiv) 128K Token Vision-Language, kompakte Multimodalität
Kimi K1.5 Januar 2025 Nicht offengelegt 128K Token Logik auf Augenhöhe mit OpenAI o1

Das Basismodell Kimi K2

Das Basismodell Kimi K2

K2 wurde im Juli 2025 veröffentlicht und war das erste Modell von Moonshot AI mit 1 Billion Parametern sowie die Grundlage für alle nachfolgenden Veröffentlichungen der K2-Serie. Es wurde unter der MIT-Lizenz als Open-Source-Software bereitgestellt und etablierte die Architektur mit 384 Experten und 32 Milliarden aktiven Parametern, die auch K2.5 nutzt. Die ursprüngliche Version unterstützte ein Kontextfenster von 128K Token, das mit dem Instruct-Update im September 2025 auf 256K erweitert wurde.

K2-Instruct-0905 brachte erhebliche Verbesserungen bei der Code-Generierung und das erweiterte Kontextfenster von 256K Token mit sich. Dieses Update erreichte 94,5% bei HumanEval, was die starke Fähigkeit zur Programmierung unterstreicht. Die Instruct-Variante bleibt als reine Textalternative für Anwender verfügbar, die keine multimodalen Funktionen benötigen.

Leichtgewichtige Modelle

Leichtgewichtige Modelle

Kimi Linear

Das im Oktober 2025 eingeführte Kimi Linear nutzt eine kompakte 48B MoE-Architektur mit nur 3 Milliarden aktivierten Parametern pro Token. Es wurde für den Einsatz auf Endgeräten und in Umgebungen mit begrenzten Ressourcen entwickelt und liefert eine überraschend starke Leistung im Verhältnis zu seiner Größe. Das Modell unterstützt ein Kontextfenster von 128K Token und läuft effizient auf Hardware für Endverbraucher. Damit eignet es sich hervorragend für lokale Installationen, mobile Anwendungen und Szenarien mit hohem Durchsatz, bei denen eine geringe Latenz wichtiger ist als maximale Kapazität.

Kimi-VL

Kimi-VL wurde im April 2025 veröffentlicht und ist ein Vision-Language-Modell mit 16 Milliarden Parametern und 3 Milliarden aktiven Parametern. Es war das erste quelloffene multimodale Modell von Moonshot AI, das speziell für Aufgaben entwickelt wurde, die Bildverständnis mit Textgenerierung kombinieren. Obwohl es für anspruchsvolle Aufgaben durch die nativen Fähigkeiten von K2.5 abgelöst wurde, bleibt Kimi-VL wertvoll für einfache Bildverarbeitungsaufgaben, bei denen das große 1T-Modell nicht wirtschaftlich wäre.

Wahl des richtigen Kimi Modells

Wahl des richtigen Kimi Modells

Die Auswahl des Modells hängt von Ihren spezifischen Anforderungen an die Leistungsfähigkeit, die Kosten und die Flexibilität bei der Bereitstellung ab. Die folgende Übersicht hilft dabei, den optimalen Typ für verschiedene Anwendungsfälle zu finden.

  • Benötigen Sie eine vielseitige KI mit maximaler Leistung, nutzen Sie K2.5 über die API oder die offizielle Website. Der Instant-Modus erledigt einfache Aufgaben effizient, während der Thinking-Modus komplexe Probleme löst.
  • Verwenden Sie für autonome Arbeitsabläufe und Forschung den K2.5 Agent oder den Agent Swarm Modus. Das Swarm-System eignet sich hervorragend für mehrstufige Aufgaben, die eine parallele Informationsbeschaffung erfordern.
  • Wählen Sie für eine selbst gehostete Bereitstellung mit vollem Funktionsumfang den Download von K2.5 über Hugging Face und nutzen Sie zur Installation vLLM, SGLang oder Docker.
  • Nutzen Sie Kimi Linear für lokale Installationen oder mobile Anwendungen. Das Modell bietet eine fähige KI auf moderater Hardware bei begrenzten Ressourcen.
  • Verwenden Sie Kimi-VL für einfache Bildverarbeitungsaufgaben bei geringem Budget. Dies ist ideal, wenn die vollständigen multimodalen Kapazitäten von K2.5 nicht erforderlich sind.
  • Wählen Sie K2-Instruct-0905 für reine Textaufgaben zu geringeren Kosten. Damit erhalten Sie die volle Rechenleistung des 1T-Modells ohne die zusätzlichen Kosten für Bilderkennung.