Kuidas alustada API kasutamist

Registreerimisprotsess platvormil platform.moonshot.ai võtab vaid mõne minuti ja nõuab e-posti kinnitamist. Pärast konto loomist saab arendaja portaali API-võtmete jaotisest genereerida vajalikud koodid. Moonshot pakub põhjalikku dokumentatsiooni nii inglise kui ka hiina keeles, sisaldades praktilisi näiteid levinumate integratsioonimustrite kohta.
- Registreeri konto aadressil platform.moonshot.ai ja kinnita oma e-posti aadress.
- Liigu arendaja töölaual API Keys jaotisesse.
- Loo oma esimene API-võti ja salvesta see turvaliselt, kuna hiljem seda enam ei kuvata.
- Paigalda OpenAI Python SDK või kasuta päringuteks cURL-i, kuna Kimi aktsepteerib standardset OpenAI-vormingut.
from openai import OpenAI
client = OpenAI(
api_key="teie_moonshot_api_võti",
base_url="https://api.moonshot.cn/v1"
)
response = client.chat.completions.create(
model="kimi-k2.5",
messages=[
{"role": "system", "content": "Sa oled abivalmis assistent."},
{"role": "user", "content": "Selgita MoE arhitektuuri tööpõhimõtet."}
],
temperature=0,7
)
print(response.choices[0].message.content)
Antud kood töötab samamoodi nagu OpenAI teenuse puhul, nõudes vaid baas-URL-i ja võtme asendamist. See tähendab, et olemasolev veatöötlus, kordusloogika ja vastuste parsimise süsteemid jäävad muutmata. Arendajad saavad seega kiiresti katsetada Kimi mudeli võimekust ilma oma rakendust uuesti kirjutamata.
Teenuse hinnastamine ja kulud

Kimi K2.5 pakub konkurentsivõimelist hinda erinevate platvormide lõikes, kusjuures ametlik API sisaldab automaatset konteksti vahemällu salvestamist. See funktsioon on eriti kasulik pikkade süsteemiviibete või korduvate dokumentide puhul.
| Pakkuja | Sisend (1M märki) | Väljund (1M märki) | Vahemällu salvestatud sisend |
|---|---|---|---|
| Moonshot Official | 0,60 $ | 3,00 $ | 0,15 $ (75 % soodsam) |
| OpenRouter | 0,45 $ | 2,20 $ | Varieerub |
| Together AI | 0,50 $ | 2,80 $ | Varieerub |
Praeguse seisuga 2026. aastal on Kimi K2.5 ligikaudu neli korda odavam kui Claude Opus 4.5, pakkudes samas samaväärset konteksti pikkust. Vahemälu funktsioon aktiveerub läbipaistvalt ja koodis muudatusi tegema ei pea, kui sama dokumenti või tekstiplokki kasutatakse mitme päringu vältel.
Kasutuspiirangud ja tasemed

Ametlik API kasutab astmelist süsteemi, sarnaselt teistele pakkujatele, mis põhineb konto kumulatiivsel sissemaksel. Kõrgemad tasemed avavad suurema paralleelsete päringute arvu ja kiirema andmevahetuse.
| Tase | Kogusumma | Paralleelsed päringud | Päringuid minutis |
|---|---|---|---|
| Tase 1 | 10 $ | 50 | 200 |
| Tase 2 | 100 $ | 100 | 500 |
| Tase 3 | 500 $ | 300 | 2 000 |
| Tase 5 | 3 000 $ | 1 000 | 10 000 |
Kui rakendus nõuab veelgi suuremaid mahte, on võimalik sõlmida erilepinguid Moonshot AI müügimeeskonnaga. Oluline on märkida, et API hinnad võivad aja jooksul muutuda vastavalt turuolukorrale ja mudeli uuendustele.
Multimodaalse API kasutamine

Mudeli natiivne arhitektuur võimaldab töödelda pilte ja videoid otse päringute sees. MoonViT-3D süsteem suudab analüüsida erineva eraldusvõimega sisendit ilma, et arendaja peaks piltide suurust käsitsi muutma.
response = client.chat.completions.create(
model="kimi-k2.5",
messages=[
{
"role": "user",
"content": [
{"type": "text", "text": "Kirjelda seda graafikut ja eralda andmed."},
{"type": "image_url", "image_url": {"url": "https://example.com/graafik.png"}}
]
}
]
)
Nägemisvõimekuse testides saavutab mudel kõrgeid tulemusi, olles eriti tugev tekstituvastuses (OCR) ja andmete eraldamises keerulistelt joonistelt. Videote puhul saab edastada kas üksikuid kaadreid või otselinke videofailidele.
Alternatiivsed juurdepääsu meetodid

Lisaks ametlikule liidesele on Kimi K2.5 kättesaadav mitmete kolmandate osapoolte platvormide kaudu, mis pakuvad paindlikku arveldust või spetsiifilisi infrastruktuurilahendusi.
- OpenRouter koondab erinevad tehisintellekti pakkujad ühtse arvelduse alla, mis on kasulik varusüsteemide loomisel.
- Together AI pakub optimeeritud infrastruktuuri madala latentsusajaga päringute teenindamiseks.
- NVIDIA NIM võimaldab ettevõtetel juurutada mudeleid läbi mikroteenuste platvormi.
- Iseseisev majutus on võimalik tänu Hugging Face keskkonnas olevatele block-fp8 vormingus mudelikaaludele.
Iseseisev majutus nõuab märkimisväärset riistvaralist ressurssi, eriti 1 triljoni parameetriga täismudeli puhul. Sellisel juhul soovitatakse kasutada tarkvara nagu vLLM või SGLang, mis on optimeeritud suurte keelemudelite käitamiseks mitme GPU-ga serverites.

