Kimi AI App Try Now

Kuidas alustada API kasutamist

Kuidas alustada API kasutamist

Registreerimisprotsess platvormil platform.moonshot.ai võtab vaid mõne minuti ja nõuab e-posti kinnitamist. Pärast konto loomist saab arendaja portaali API-võtmete jaotisest genereerida vajalikud koodid. Moonshot pakub põhjalikku dokumentatsiooni nii inglise kui ka hiina keeles, sisaldades praktilisi näiteid levinumate integratsioonimustrite kohta.

  1. Registreeri konto aadressil platform.moonshot.ai ja kinnita oma e-posti aadress.
  2. Liigu arendaja töölaual API Keys jaotisesse.
  3. Loo oma esimene API-võti ja salvesta see turvaliselt, kuna hiljem seda enam ei kuvata.
  4. Paigalda OpenAI Python SDK või kasuta päringuteks cURL-i, kuna Kimi aktsepteerib standardset OpenAI-vormingut.
from openai import OpenAI

client = OpenAI(
    api_key="teie_moonshot_api_võti",
    base_url="https://api.moonshot.cn/v1"
)

response = client.chat.completions.create(
    model="kimi-k2.5",
    messages=[
        {"role": "system", "content": "Sa oled abivalmis assistent."},
        {"role": "user", "content": "Selgita MoE arhitektuuri tööpõhimõtet."}
    ],
    temperature=0,7
)

print(response.choices[0].message.content)

Antud kood töötab samamoodi nagu OpenAI teenuse puhul, nõudes vaid baas-URL-i ja võtme asendamist. See tähendab, et olemasolev veatöötlus, kordusloogika ja vastuste parsimise süsteemid jäävad muutmata. Arendajad saavad seega kiiresti katsetada Kimi mudeli võimekust ilma oma rakendust uuesti kirjutamata.

Kasutuspiirangud ja tasemed

Kasutuspiirangud ja tasemed

Ametlik API kasutab astmelist süsteemi, sarnaselt teistele pakkujatele, mis põhineb konto kumulatiivsel sissemaksel. Kõrgemad tasemed avavad suurema paralleelsete päringute arvu ja kiirema andmevahetuse.

Tase Kogusumma Paralleelsed päringud Päringuid minutis
Tase 1 10 $ 50 200
Tase 2 100 $ 100 500
Tase 3 500 $ 300 2 000
Tase 5 3 000 $ 1 000 10 000

Kui rakendus nõuab veelgi suuremaid mahte, on võimalik sõlmida erilepinguid Moonshot AI müügimeeskonnaga. Oluline on märkida, et API hinnad võivad aja jooksul muutuda vastavalt turuolukorrale ja mudeli uuendustele.

Multimodaalse API kasutamine

Multimodaalse API kasutamine

Mudeli natiivne arhitektuur võimaldab töödelda pilte ja videoid otse päringute sees. MoonViT-3D süsteem suudab analüüsida erineva eraldusvõimega sisendit ilma, et arendaja peaks piltide suurust käsitsi muutma.

response = client.chat.completions.create(
    model="kimi-k2.5",
    messages=[
        {
            "role": "user",
            "content": [
                {"type": "text", "text": "Kirjelda seda graafikut ja eralda andmed."},
                {"type": "image_url", "image_url": {"url": "https://example.com/graafik.png"}}
            ]
        }
    ]
)

Nägemisvõimekuse testides saavutab mudel kõrgeid tulemusi, olles eriti tugev tekstituvastuses (OCR) ja andmete eraldamises keerulistelt joonistelt. Videote puhul saab edastada kas üksikuid kaadreid või otselinke videofailidele.

Alternatiivsed juurdepääsu meetodid

Alternatiivsed juurdepääsu meetodid

Lisaks ametlikule liidesele on Kimi K2.5 kättesaadav mitmete kolmandate osapoolte platvormide kaudu, mis pakuvad paindlikku arveldust või spetsiifilisi infrastruktuurilahendusi.

  • OpenRouter koondab erinevad tehisintellekti pakkujad ühtse arvelduse alla, mis on kasulik varusüsteemide loomisel.
  • Together AI pakub optimeeritud infrastruktuuri madala latentsusajaga päringute teenindamiseks.
  • NVIDIA NIM võimaldab ettevõtetel juurutada mudeleid läbi mikroteenuste platvormi.
  • Iseseisev majutus on võimalik tänu Hugging Face keskkonnas olevatele block-fp8 vormingus mudelikaaludele.

Iseseisev majutus nõuab märkimisväärset riistvaralist ressurssi, eriti 1 triljoni parameetriga täismudeli puhul. Sellisel juhul soovitatakse kasutada tarkvara nagu vLLM või SGLang, mis on optimeeritud suurte keelemudelite käitamiseks mitme GPU-ga serverites.

Korduma kippuvad küsimused

Kas Kimi API ühildub OpenAI SDK-ga?

Jah, see ühildub täielikult. Piisab baas-URL-i muutmisest aadressiks api.moonshot.cn/v1 ja Moonshot API-võtme kasutamisest. Kõik funktsioonid, sealhulgas voogedastus ja struktureeritud väljundid, toimivad samamoodi nagu OpenAI keskkonnas.

Kui suur on maksimaalne kontekstiaken?

Kimi K2.5 toetab kuni 262 144 märki ühe päringu kohta. See võimaldab analüüsida terveid koodibaase või mahukaid raamatuid ühes päringus, ilma et sisu peaks osadeks jagama.

Kuidas töötab vahemällu salvestamine?

Automaatne vahemälu aktiveerub, kui süsteem tuvastab korduva algusteksti või dokumendi järjestikustes päringutes. Vahemällu salvestatud märgid on tavapärastest märgatavalt odavamad, vähendades kulusid kuni 75 % võrra.

Kas mudelit saab ise majutada?

Kimi K2.5 on saadaval modifitseeritud MIT litsentsi alusel. Hugging Face platvormilt saab alla laadida kaalud ning käitada neid vLLM või Dockeri abil. Ressursinõudlikkuse vähendamiseks on saadaval ka väiksem Kimi Linear versioon.

Milliseid sisendi tüüpe Kimi API toetab?

Mudel toetab natiivselt teksti, pilte, videoid ja dokumente, võimaldades luua monoliitseid multimodaalseid rakendusi.

Milliseid režiime Kimi K2.5 pakub?

Kimi K2.5-l on neli põhirežiimi: Instant, Thinking, Agent ja Agent Swarm, mis katavad laia valikut kasutusjuhte alates kiiretest vastustest kuni keeruliste autonoomsete töövoogudeni.