Mengenal Model Kimi: AI Multimodal dan Agent Swarm Tercanggih

Temukan performa luar biasa dari ekosistem Kimi K2.5 dengan arsitektur 1T MoE and koordinasi Agent Swarm.

Gambaran Umum Model Unggulan Kimi K2.5 Model Dasar Kimi K2 Model Versi Ringan Model Penalaran Kimi K1.5 Cara Memilih FAQ

Gambaran Umum Model Kimi

Platform Kimi dari Moonshot AI menawarkan jajaran model AI yang mengesankan dengan arsitektur Mixture-of-Experts sebesar 1 triliun parameter. Model unggulan Kimi K2.5 yang dirilis pada Januari 2026 menghadirkan kemampuan multimodal asli, koordinasi Agent Swarm, dan performa benchmark yang bersaing dengan GPT-5.2 dan Claude Opus 4.5. Baik Anda membutuhkan respons cepat untuk pertanyaan sederhana, penalaran mendalam untuk masalah kompleks, atau alur kerja agen otonom, keluarga model Kimi mencakup setiap kebutuhan penggunaan.

Ekosistem Kimi telah berkembang pesat sejak peluncuran K1.5 pada Januari 2025. Setiap rilis berikutnya telah memperluas kemampuan dari penalaran khusus teks menjadi pemahaman multimodal penuh dengan video, gambar, dan dokumen. Semua model seri K2 berbagi fondasi 1T MoE yang sama namun berbeda dalam data pelatihan, rangkaian fitur, dan mode operasional. Seluruh model K2.5 bersifat sumber terbuka di bawah Lisensi MIT yang Dimodifikasi dan tersedia di Hugging Face untuk penerapan mandiri.

Model	Tanggal Rilis	Parameter	Jendela Konteks	Fitur Utama
Kimi K2.5	Januari 2026	1T MoE (32B aktif)	256K token	Multimodal asli, Agent Swarm, sumber terbuka
Kimi K2-Instruct-0905	September 2025	1T MoE (32B aktif)	256K token	Peningkatan pengodean, konteks diperluas
Kimi K2	Juli 2025	1T MoE (32B aktif)	128K token	1T MoE pertama, basis sumber terbuka
Kimi Linear	Oktober 2025	48B MoE (3B aktif)	128K token	Ringan, inferensi efisien
Kimi-VL	April 2025	16B MoE (3B aktif)	128K token	Visi-bahasa, multimodal ringkas
Kimi K1.5	Januari 2025	Tidak disebutkan	128K token	Penalaran setara dengan OpenAI o1

Model Unggulan Kimi K2.5

Kimi K2.5 mewakili model paling mumpuni dalam jajaran ini yang dilatih pada sekitar 15 triliun campuran token visual dan teks melalui pra-pelatihan berkelanjutan di atas basis K2. Arsitekturnya menggunakan 384 pakar dengan 8 pakar yang diaktifkan per token, Multi-Latent Attention (MLA), dan aktivasi SwiGLU. Desain multimodal asli mengintegrasikan MoonViT-3D yang merupakan enkoder visi 400M parameter menggunakan pengemasan NaViT untuk input gambar resolusi variabel.

Empat Mode Operasional Utama

K2.5 beroperasi dalam empat mode berbeda yang masing-masing dioptimalkan untuk alur kerja yang bervariasi. K2.5 Instant memberikan respons cepat tanpa proses berpikir untuk pertanyaan langsung. K2.5 Thinking mengaktifkan penalaran berantai untuk masalah yang kompleks. K2.5 Agent memungkinkan penggunaan alat agen tunggal untuk penyelesaian tugas otonom. K2.5 Agent Swarm mengoordinasikan hingga 100 sub-agen khusus yang bekerja secara paralel untuk memangkas waktu eksekusi hingga 4,5 kali lipat.

Mode	Kasus Penggunaan	Kecepatan	Kedalaman Penalaran
K2.5 Instant	Jawaban cepat, tugas sederhana	Paling Cepat	Standar
K2.5 Thinking	Matematika, logika, analisis rumit	Moderat	Penalaran berantai mendalam
K2.5 Agent	Penggunaan alat, eksekusi kode, browsing	Tergantung tugas	Penalaran agen
K2.5 Agent Swarm	Riset kompleks, alur kerja multisaluran	4,5x lebih cepat dari agen tunggal	Multi-agen terdistribusi

Pencapaian Benchmark dan Performa

K2.5 mencapai skor 96,1% pada AIME 2025 (GPT-5.2: 100%), 98,0% pada MATH-500, dan 87,6% pada GPQA-Diamond. Dalam hal pengodean, model ini mencetak 83,1% pada LiveCodeBench v6 yang secara signifikan mengungguli skor Claude Opus 4.5 sebesar 64,0%. Mode Agent Swarm berhasil meraih 50,2% pada Humanity's Last Exam dengan bantuan alat serta melampaui GPT-5.2 yang mencetak 45,5% dengan biaya 76% lebih rendah. Kemampuan visi mencakup skor 92,3% pada OCRBench dan 86,6% pada VideoMMMU.

Model Dasar Kimi K2

Dirilis pada Juli 2025, K2 adalah model MoE 1 triliun parameter pertama dari Moonshot AI serta menjadi fondasi bagi semua rilis seri K2 setelahnya. Sebagai model yang bersifat sumber terbuka di bawah Lisensi MIT, K2 menetapkan arsitektur 384 pakar dengan 32B parameter aktif yang diwarisi oleh K2.5. Rilis aslinya mendukung jendela konteks sebesar 128K token yang kemudian diperluas menjadi 256K melalui pembaruan Instruct pada September 2025.

Kimi K2-Instruct-0905 menghadirkan peningkatan pengodean yang signifikan dan jendela konteks 256K yang lebih luas. Pembaruan ini mencetak skor 94,5% pada HumanEval yang menunjukkan kemampuan pembuatan kode yang sangat kuat. Varian Instruct tetap tersedia sebagai alternatif khusus teks bagi para pengguna yang tidak memerlukan fitur-fitur multimodal.

Model Kimi Versi Ringan

Model Kimi Linear

Diluncurkan pada Oktober 2025, Kimi Linear menggunakan arsitektur MoE 48B yang ringkas dengan hanya 3B parameter aktif per token. Model ini dirancang untuk penerapan edge dan lingkungan dengan sumber daya terbatas namun memberikan performa yang sangat mumpuni dibandingkan ukurannya. Model ini mendukung konteks 128K token dan berjalan efisien pada perangkat keras kelas konsumen sehingga cocok untuk penggunaan lokal, aplikasi seluler, dan skenario throughput tinggi yang mengutamakan latensi rendah.

Model Kimi VL

Kimi-VL dirilis pada April 2025 sebagai model visi-bahasa MoE dengan 16B parameter dan 3B parameter aktif. Ini merupakan model multimodal sumber terbuka pertama dari Moonshot AI yang dirancang untuk tugas-tugas penggabungan pemahaman gambar dengan pembuatan teks. Meskipun posisinya mulai digantikan oleh kemampuan multimodal asli K2.5 untuk beban kerja berat, Kimi-VL tetap berharga untuk tugas visi ringan di mana model 1T penuh dianggap terlalu berlebihan.

Model Penalaran Kimi K1.5

K1.5 yang dirilis pada Januari 2025 menandai masuknya Moonshot AI ke dalam ranah model penalaran tingkat lanjut. Model ini mengklaim kesetaraan performa dengan OpenAI o1 pada benchmark matematika dan pengodean serta memperkenalkan kemampuan penalaran berbasis pembelajaran penguatan ke platform Kimi. Meskipun jumlah parameter pastinya tidak pernah diungkapkan, K1.5 membuktikan bahwa Moonshot AI mampu bersaing di garis depan penalaran AI.

K1.5 berfokus secara eksklusif pada penalaran berbasis teks tanpa kemampuan multimodal. Perilisannya menetapkan Moonshot AI sebagai kompetitor serius dalam ruang model penalaran dan meletakkan dasar bagi seri K2 yang lebih mumpuni. Pengguna yang masih menggunakan K1.5 disarankan untuk beralih ke K2.5 karena model terbaru tersebut melampaui K1.5 dalam setiap benchmark sekaligus menambahkan kemampuan multimodal serta fitur agen otonom.

Cara Memilih Model Kimi

Pemilihan model sangat bergantung pada kebutuhan spesifik Anda terkait kemampuan, biaya, dan fleksibilitas penerapan. Panduan berikut membantu menyesuaikan kasus penggunaan dengan pilihan model yang paling optimal.

Kebutuhan AI serbaguna dengan kemampuan maksimal: Gunakan K2.5 melalui API atau situs resmi. Mode Instant menangani tugas sederhana secara efisien sementara mode Thinking menangani penalaran rumit.
Alur kerja otonom dan riset mandiri: Gunakan K2.5 Agent atau mode Agent Swarm. Sistem swarm sangat unggul dalam tugas multisaluran yang membutuhkan pengumpulan informasi secara paralel.
Penerapan mandiri dengan fitur lengkap: Unduh K2.5 dari Hugging Face dan terapkan melalui vLLM, SGLang, atau Docker sesuai kebutuhan infrastruktur Anda.
Penerapan ringan atau perangkat edge: Gunakan Kimi Linear (48B MoE) untuk lingkungan dengan sumber daya terbatas yang memerlukan AI mumpuni pada perangkat keras menengah.
Tugas visi sederhana dengan anggaran terbatas: Gunakan Kimi-VL (16B MoE) saat kemampuan multimodal penuh dari K2.5 melampaui kebutuhan teknis Anda.
Penalaran teks murni dengan biaya rendah: Gunakan K2-Instruct-0905 jika Anda tidak membutuhkan kemampuan visi tetapi menginginkan kekuatan penalaran dari arsitektur 1T MoE.

Pertanyaan yang Sering Diajukan

Model Kimi mana yang terbaik

Kimi K2.5 adalah model paling mumpuni di seluruh metrik yang mencakup penalaran, pengodean, visi, dan tugas agen. Model ini mencetak skor 96,1% pada AIME 2025 serta memimpin pada OCRBench dengan skor 92,3%. Bagi pengguna yang tidak membutuhkan performa puncak, Kimi Linear menawarkan kemampuan yang sangat baik dengan biaya komputasi yang jauh lebih kecil.

Apakah model Kimi gratis

Saat ini, semua model Kimi dapat diakses secara gratis melalui situs web resmi dan aplikasi seluler. Akses API menggunakan sistem harga per token yang dimulai dari $0,60 per satu juta token input untuk model K2.5. Bobot model sumber terbuka di Hugging Face juga gratis untuk diunduh dan digunakan untuk tujuan komersial di bawah Lisensi MIT yang Dimodifikasi.

Bisa saya menjalankan Kimi lokal

K2.5 dan K2 tersedia di Hugging Face dalam format block-fp8 dan dapat diterapkan melalui vLLM, SGLang, Transformers, atau Docker. Model 1T penuh membutuhkan sumber daya GPU yang sangat besar untuk beroperasi secara optimal. Kimi Linear (48B MoE) jauh lebih cocok untuk penerapan lokal pada perangkat keras kelas konsumen.

Apa perbedaan K2 dan K2.5

K2.5 menambahkan kemampuan multimodal asli melalui enkoder visi MoonViT-3D serta mode Agent Swarm yang mampu menjalankan 100 sub-agen paralel. K2 terbatas pada teks saja dengan jendela konteks 128K sementara K2.5 memproses gambar, video, dan dokumen secara asli dengan jendela konteks hingga 256K token.

Apa itu Agent Swarm pada Kimi K2.5?

Agent Swarm adalah mode yang mengoordinasikan hingga 100 sub-agen khusus bekerja secara paralel untuk menyelesaikan tugas besar, memangkas waktu eksekusi hingga 4,5 kali lipat.

Berapa parameter yang dimiliki Kimi K2.5?

Kimi K2.5 menggunakan arsitektur Mixture-of-Experts (MoE) sebesar 1 triliun parameter dengan 32 miliar parameter aktif per token.