Kimi AI App Try Now

Mengenal Model Kimi: AI Multimodal dan Agent Swarm Tercanggih

Temukan performa luar biasa dari ekosistem Kimi K2.5 dengan arsitektur 1T MoE and koordinasi Agent Swarm.

Coba Sekarang

Gambaran Umum Model Kimi

Gambaran Umum Model Kimi

Platform Kimi dari Moonshot AI menawarkan jajaran model AI yang mengesankan dengan arsitektur Mixture-of-Experts sebesar 1 triliun parameter. Model unggulan Kimi K2.5 yang dirilis pada Januari 2026 menghadirkan kemampuan multimodal asli, koordinasi Agent Swarm, dan performa benchmark yang bersaing dengan GPT-5.2 dan Claude Opus 4.5. Baik Anda membutuhkan respons cepat untuk pertanyaan sederhana, penalaran mendalam untuk masalah kompleks, atau alur kerja agen otonom, keluarga model Kimi mencakup setiap kebutuhan penggunaan.

Ekosistem Kimi telah berkembang pesat sejak peluncuran K1.5 pada Januari 2025. Setiap rilis berikutnya telah memperluas kemampuan dari penalaran khusus teks menjadi pemahaman multimodal penuh dengan video, gambar, dan dokumen. Semua model seri K2 berbagi fondasi 1T MoE yang sama namun berbeda dalam data pelatihan, rangkaian fitur, dan mode operasional. Seluruh model K2.5 bersifat sumber terbuka di bawah Lisensi MIT yang Dimodifikasi dan tersedia di Hugging Face untuk penerapan mandiri.

Model Tanggal Rilis Parameter Jendela Konteks Fitur Utama
Kimi K2.5 Januari 2026 1T MoE (32B aktif) 256K token Multimodal asli, Agent Swarm, sumber terbuka
Kimi K2-Instruct-0905 September 2025 1T MoE (32B aktif) 256K token Peningkatan pengodean, konteks diperluas
Kimi K2 Juli 2025 1T MoE (32B aktif) 128K token 1T MoE pertama, basis sumber terbuka
Kimi Linear Oktober 2025 48B MoE (3B aktif) 128K token Ringan, inferensi efisien
Kimi-VL April 2025 16B MoE (3B aktif) 128K token Visi-bahasa, multimodal ringkas
Kimi K1.5 Januari 2025 Tidak disebutkan 128K token Penalaran setara dengan OpenAI o1

Model Unggulan Kimi K2.5

Model Unggulan Kimi K2.5

Kimi K2.5 mewakili model paling mumpuni dalam jajaran ini yang dilatih pada sekitar 15 triliun campuran token visual dan teks melalui pra-pelatihan berkelanjutan di atas basis K2. Arsitekturnya menggunakan 384 pakar dengan 8 pakar yang diaktifkan per token, Multi-Latent Attention (MLA), dan aktivasi SwiGLU. Desain multimodal asli mengintegrasikan MoonViT-3D yang merupakan enkoder visi 400M parameter menggunakan pengemasan NaViT untuk input gambar resolusi variabel.

Empat Mode Operasional Utama

K2.5 beroperasi dalam empat mode berbeda yang masing-masing dioptimalkan untuk alur kerja yang bervariasi. K2.5 Instant memberikan respons cepat tanpa proses berpikir untuk pertanyaan langsung. K2.5 Thinking mengaktifkan penalaran berantai untuk masalah yang kompleks. K2.5 Agent memungkinkan penggunaan alat agen tunggal untuk penyelesaian tugas otonom. K2.5 Agent Swarm mengoordinasikan hingga 100 sub-agen khusus yang bekerja secara paralel untuk memangkas waktu eksekusi hingga 4,5 kali lipat.

Mode Kasus Penggunaan Kecepatan Kedalaman Penalaran
K2.5 Instant Jawaban cepat, tugas sederhana Paling Cepat Standar
K2.5 Thinking Matematika, logika, analisis rumit Moderat Penalaran berantai mendalam
K2.5 Agent Penggunaan alat, eksekusi kode, browsing Tergantung tugas Penalaran agen
K2.5 Agent Swarm Riset kompleks, alur kerja multisaluran 4,5x lebih cepat dari agen tunggal Multi-agen terdistribusi

Pencapaian Benchmark dan Performa

K2.5 mencapai skor 96,1% pada AIME 2025 (GPT-5.2: 100%), 98,0% pada MATH-500, dan 87,6% pada GPQA-Diamond. Dalam hal pengodean, model ini mencetak 83,1% pada LiveCodeBench v6 yang secara signifikan mengungguli skor Claude Opus 4.5 sebesar 64,0%. Mode Agent Swarm berhasil meraih 50,2% pada Humanity's Last Exam dengan bantuan alat serta melampaui GPT-5.2 yang mencetak 45,5% dengan biaya 76% lebih rendah. Kemampuan visi mencakup skor 92,3% pada OCRBench dan 86,6% pada VideoMMMU.

Model Dasar Kimi K2

Model Dasar Kimi K2

Dirilis pada Juli 2025, K2 adalah model MoE 1 triliun parameter pertama dari Moonshot AI serta menjadi fondasi bagi semua rilis seri K2 setelahnya. Sebagai model yang bersifat sumber terbuka di bawah Lisensi MIT, K2 menetapkan arsitektur 384 pakar dengan 32B parameter aktif yang diwarisi oleh K2.5. Rilis aslinya mendukung jendela konteks sebesar 128K token yang kemudian diperluas menjadi 256K melalui pembaruan Instruct pada September 2025.

Kimi K2-Instruct-0905 menghadirkan peningkatan pengodean yang signifikan dan jendela konteks 256K yang lebih luas. Pembaruan ini mencetak skor 94,5% pada HumanEval yang menunjukkan kemampuan pembuatan kode yang sangat kuat. Varian Instruct tetap tersedia sebagai alternatif khusus teks bagi para pengguna yang tidak memerlukan fitur-fitur multimodal.

Model Kimi Versi Ringan

Model Kimi Versi Ringan

Model Kimi Linear

Diluncurkan pada Oktober 2025, Kimi Linear menggunakan arsitektur MoE 48B yang ringkas dengan hanya 3B parameter aktif per token. Model ini dirancang untuk penerapan edge dan lingkungan dengan sumber daya terbatas namun memberikan performa yang sangat mumpuni dibandingkan ukurannya. Model ini mendukung konteks 128K token dan berjalan efisien pada perangkat keras kelas konsumen sehingga cocok untuk penggunaan lokal, aplikasi seluler, dan skenario throughput tinggi yang mengutamakan latensi rendah.

Model Kimi VL

Kimi-VL dirilis pada April 2025 sebagai model visi-bahasa MoE dengan 16B parameter dan 3B parameter aktif. Ini merupakan model multimodal sumber terbuka pertama dari Moonshot AI yang dirancang untuk tugas-tugas penggabungan pemahaman gambar dengan pembuatan teks. Meskipun posisinya mulai digantikan oleh kemampuan multimodal asli K2.5 untuk beban kerja berat, Kimi-VL tetap berharga untuk tugas visi ringan di mana model 1T penuh dianggap terlalu berlebihan.

Model Penalaran Kimi K1.5

Model Penalaran Kimi K1.5

K1.5 yang dirilis pada Januari 2025 menandai masuknya Moonshot AI ke dalam ranah model penalaran tingkat lanjut. Model ini mengklaim kesetaraan performa dengan OpenAI o1 pada benchmark matematika dan pengodean serta memperkenalkan kemampuan penalaran berbasis pembelajaran penguatan ke platform Kimi. Meskipun jumlah parameter pastinya tidak pernah diungkapkan, K1.5 membuktikan bahwa Moonshot AI mampu bersaing di garis depan penalaran AI.

K1.5 berfokus secara eksklusif pada penalaran berbasis teks tanpa kemampuan multimodal. Perilisannya menetapkan Moonshot AI sebagai kompetitor serius dalam ruang model penalaran dan meletakkan dasar bagi seri K2 yang lebih mumpuni. Pengguna yang masih menggunakan K1.5 disarankan untuk beralih ke K2.5 karena model terbaru tersebut melampaui K1.5 dalam setiap benchmark sekaligus menambahkan kemampuan multimodal serta fitur agen otonom.

Pertanyaan yang Sering Diajukan

Model Kimi mana yang terbaik

Kimi K2.5 adalah model paling mumpuni di seluruh metrik yang mencakup penalaran, pengodean, visi, dan tugas agen. Model ini mencetak skor 96,1% pada AIME 2025 serta memimpin pada OCRBench dengan skor 92,3%. Bagi pengguna yang tidak membutuhkan performa puncak, Kimi Linear menawarkan kemampuan yang sangat baik dengan biaya komputasi yang jauh lebih kecil.

Apakah model Kimi gratis

Saat ini, semua model Kimi dapat diakses secara gratis melalui situs web resmi dan aplikasi seluler. Akses API menggunakan sistem harga per token yang dimulai dari $0,60 per satu juta token input untuk model K2.5. Bobot model sumber terbuka di Hugging Face juga gratis untuk diunduh dan digunakan untuk tujuan komersial di bawah Lisensi MIT yang Dimodifikasi.

Bisa saya menjalankan Kimi lokal

K2.5 dan K2 tersedia di Hugging Face dalam format block-fp8 dan dapat diterapkan melalui vLLM, SGLang, Transformers, atau Docker. Model 1T penuh membutuhkan sumber daya GPU yang sangat besar untuk beroperasi secara optimal. Kimi Linear (48B MoE) jauh lebih cocok untuk penerapan lokal pada perangkat keras kelas konsumen.

Apa perbedaan K2 dan K2.5

K2.5 menambahkan kemampuan multimodal asli melalui enkoder visi MoonViT-3D serta mode Agent Swarm yang mampu menjalankan 100 sub-agen paralel. K2 terbatas pada teks saja dengan jendela konteks 128K sementara K2.5 memproses gambar, video, dan dokumen secara asli dengan jendela konteks hingga 256K token.

Apa itu Agent Swarm pada Kimi K2.5?

Agent Swarm adalah mode yang mengoordinasikan hingga 100 sub-agen khusus bekerja secara paralel untuk menyelesaikan tugas besar, memangkas waktu eksekusi hingga 4,5 kali lipat.

Berapa parameter yang dimiliki Kimi K2.5?

Kimi K2.5 menggunakan arsitektur Mixture-of-Experts (MoE) sebesar 1 triliun parameter dengan 32 miliar parameter aktif per token.