Kimi AI App Try Now

Rishikimi i Modeleve Kimi

Eksploroni fuqinë e inteligjencës artificiale multimodale me arkitekturën 1 trilion parametra MoE dhe agjentët inteligjentë.

Zbuloni Kimi K2.5

Modeli kryesor Kimi K2.5

Modeli kryesor Kimi K2.5

Kimi K2.5 përfaqëson modelin më të fuqishëm në linjë, i trajnuar në rreth 15 trilionë token të përzier vizualë dhe tekstualë përmes para-trajnimit të vazhdueshëm mbi bazën K2. Arkitektura përdor 384 ekspertë me 8 të aktivizuar për çdo token, Multi-Latent Attention (MLA) dhe aktivizimin SwiGLU. Dizajni nativ multimodal integron MoonViT-3D, një kodues vizual me 400M parametra që përdor paketimin NaViT për hyrjen e imazheve me rezolucion të ndryshueshëm.

Katër modalitete operacionale

K2.5 operon në katër modalitete të dallueshme, secili i optimizuar për rrjedha të ndryshme pune. K2.5 Instant ofron përgjigje të shpejta pa proces arsyetimi për kërkesa të thjeshta. K2.5 Thinking aktivizon arsyetimin varg-mendimi për probleme komplekse. K2.5 Agent mundëson përdorimin e mjetetve nga një agjent i vetëm për përfundimin e detyrave autonome. K2.5 Agent Swarm koordinon deri në 100 nën-agjentë të specializuar që punojnë në paralel, duke reduktuar kohën e ekzekutimit me 4,5 herë.

Modaliteti Rasti i përdorimit Shpejtësia Thellësia e arsyetimit
K2.5 Instant Përgjigje të shpejta, detyra të thjeshta Më e shpejta Standarde
K2.5 Thinking Matematikë, logjikë, analizë komplekse E moderuar Varg-mendimi i thellë
K2.5 Agent Përdorim mjetesh, ekzekutim kodi, lundrim Varet nga detyra Arsyetim agjentik
K2.5 Agent Swarm Kërkim kompleks, rrjedha pune me shumë hapa 4,5x më shpejt se një agjent Arsyetim i shpërndarë

Performanca në teste

K2.5 arrin 96,1% në AIME 2025 (GPT-5.2: 100%), 98,0% në MATH-500 dhe 87,6% në GPQA-Diamond. Në kodim, ky model shënon 83,1% në LiveCodeBench v6, duke tejkaluar ndjeshëm Claude Opus 4.5 me 64,0%. Modaliteti Agent Swarm arriti 50,2% në Humanity's Last Exam duke përdorur mjete, duke kaluar rezultatin 45,5% të GPT-5.2 me një kosto 76% më të ulët. Aftësitë vizuale përfshijnë 92,3% në OCRBench dhe 86,6% në VideoMMMU.

Modeli bazë Kimi K2

Modeli bazë Kimi K2

I lançuar në korrik 2025, K2 ishte modeli i parë MoE me 1 trilion parametra nga Moonshot AI dhe baza për të gjitha lëshimet pasuese të serisë K2. I ofruar me burim të hapur nën Licencën MIT, ai vendosi arkitekturën me 384 ekspertë dhe 32B parametra aktivë që trashëgon K2.5. Lëshimi origjinal mbështeste 128K token kontekst, i cili më vonë u zgjerua në 256K me përditësimin Instruct të shtatorit 2025.

K2-Instruct-0905 solli përmirësime të ndjeshme në kodim dhe dritaren e zgjeruar të kontekstit 256K. Ky përditësim shënoi 94,5% në HumanEval, duke demonstruar aftësi të forta të gjenerimit të kodit. Varianti Instruct mbetet i disponueshëm si një alternativë vetëm me tekst për përdoruesit që nuk kanë nevojë për veçori multimodale.

Modelet e lehta

Modelet e lehta

Kimi Linear

I prezantuar në tetor 2025, Kimi Linear përdor një arkitekturë kompakte 48B MoE me vetëm 3B parametra të aktivizuar për çdo token. I projektuar për pajisjet fundore dhe mjediset me burime të kufizuara, ai ofron një performancë çuditërisht të lartë në raport me madhësinë e tij. Modeli mbështet 128K token kontekst dhe ekzekutohet me efikasitet në pajisje të nivelit konsumator, duke e bërë atë të përshtatshëm për aplikacione celulare.

Kimi-VL

I lançuar në prill 2025, Kimi-VL është një model vision-language 16B MoE me 3B parametra aktivë. Ai ishte modeli i parë multimodal me burim të hapur nga Moonshot AI, i krijuar për detyra që kombinojnë kuptimin e imazhit me gjenerimin e tekstit. Megjithëse është zëvendësuar nga aftësitë e K2.5 për punë kërkuese, Kimi-VL mbetet i vlefshëm për detyra të lehta vizuale ku modeli i plotë 1T do të ishte i tepërt.

Si të zgjidhni modelin e duhur

Si të zgjidhni modelin e duhur

Përzgjedhja e modelit varet nga kërkesat tuaja specifike për aftësinë, koston dhe fleksibilitetin e vendosjes. Udhëzuesi i mëposhtëm ndihmon në përshtatjen e rasteve të përdorimit me modelin optimal.

  • Përdorni K2.5 përmes API ose faqes zyrtare për inteligjencë artificiale me aftësi maksimale. Modaliteti Instant përpunon detyrat e thjeshta, ndërsa Thinking zgjidh arsyetimet komplekse.
  • Zgjidhni modelet K2.5 Agent ose Agent Swarm për rrjedha pune autonome dhe kërkime shkencore. Sistemi Swarm shkëlqen në detyra me shumë hapa që kërkojnë mbledhje paralele informacioni.
  • Shkarkoni K2.5 nga Hugging Face për vendosje në serverë lokalë me veçori të plota. Ky model mund të instalohet përmes vLLM, SGLang ose Docker.
  • Përdorni Kimi Linear për pajisje me burime të kufizuara hardware-ike. Ky model është ideal për mjedise ku performanca kërkohet në pajisje modeste.
  • Zgjidhni Kimi-VL për detyra të thjeshta vizuale me kosto të ulët. Ky model rekomandohet kur aftësitë e plota multimodale të K2.5 tejkalojnë nevojat tuaja aktuale.
  • Përdorni K2-Instruct-0905 për arsyetim vetëm me tekst me kosto më të ulët. Ky variant ruan fuqinë e arsyetimit 1T MoE pa përfshirë funksionet e vizionit.

Pyetjet e bëra më shpesh

Cili model Kimi është më i miri?

Kimi K2.5 është modeli më i aftë në të gjitha metrikat si arsyetimi, kodimi, vizioni dhe detyrat agjentike. Ai kryeson në OCRBench me 92,3% dhe shënon rezultate superiore në LiveCodeBench.

A janë modelet Kimi falas?

Po, të gjitha modelet Kimi janë të aksesueshme falas përmes faqes kimi.com dhe aplikacioneve celulare. Peshat e modeleve open-source në Hugging Face janë gjithashtu falas.

A mund të ekzekutoj modelet lokalisht?

Modelet K2.5 dhe K2 mund të ekzekutohen në serverë lokalë. Kimi Linear është i përshtatshëm edhe për pajisje konsumatore më pak të fuqishme.

Cili është ndryshimi midis K2 dhe K2.5?

K2.5 shton aftësi native multimodale (video/imazh), modalitetin Agent Swarm dhe përmirësime të mëdha në arsyetim krahasuar me K2.

Çfarë është arkitektura MoE?

Mixture-of-Experts (MoE) është një arkitekturë ku vetëm një pjesë e parametrave (p.sh. 32B nga 1T) aktivizohen për çdo kërkesë, duke rritur efikasitetin.

Sa është dritarja e kontekstit për Kimi K2.5?

Modeli Kimi K2.5 mbështet një dritare konteksti deri në 256K token.

A ka versione për përdorim në celular?

Po, Kimi Linear është i projektuar posaçërisht për pajisje celulare dhe mjedise me burime të kufizuara.