Kimiモデルの全容：最新K2.5の性能から軽量版Linearまで徹底解説

1兆パラメータ級のMoEアーキテクチャが切り拓く、次世代のマルチモーダルAI体験を今すぐ体感しましょう。

概要と特徴 Kimi K2.5 Kimi K2 軽量派生モデル Kimi K1.5 最適な選び方 FAQ

Kimiモデルの概要と特徴

Moonshot AIが提供するKimiプラットフォームは、1兆パラメータ級の混合エキスパート（MoE）アーキテクチャを基盤とした強力なAIモデル群を展開しています。2026年1月にリリースされたフラッグシップモデルのKimi K2.5は、ネイティブなマルチモーダル機能、エージェントスウォーム調整機能を備え、GPT-5.2やClaude Opus 4.5に匹敵するベンチマーク性能を誇ります。迅速なレスポンスが求められる日常的な質問から、複雑な推論を必要とする高度な課題解決まで、あらゆるユースケースに対応可能です。

このKimiエコシステムは、2025年1月のK1.5発表以来、急速な進化を遂げてきました。当初のテキスト中心の推論機能から、最新モデルでは動画、画像、文書を包括的に理解する完全なマルチモーダル性能へと拡張されています。K2シリーズのモデルはすべて1兆パラメータのMoE構造を共有していますが、学習データや機能、運用モードにおいてそれぞれの特性を持っています。また、K2.5は修正MITライセンスのもとでオープンソースとして公開されており、Hugging Faceを通じて自社サーバーなどへのデプロイも可能です。

モデル名	リリース時期	パラメータ数	コンテキストウィンドウ	主な特徴
Kimi K2.5	2026年1月	1T MoE (有効32B)	256Kトークン	ネイティブマルチモーダル、エージェントスウォーム、オープンソース
Kimi K2-Instruct-0905	2025年9月	1T MoE (有効32B)	256Kトークン	プログラミング性能の向上、長文対応
Kimi K2	2025年7月	1T MoE (有効32B)	128Kトークン	初の1兆パラメータMoE、オープンソース基盤
Kimi Linear	2025年10月	48B MoE (有効3B)	128Kトークン	軽量設計、高速な推論処理
Kimi-VL	2025年4月	16B MoE (有効3B)	128Kトークン	視覚言語モデル、コンパクトなマルチモーダル
Kimi K1.5	2025年1月	非公開	128Kトークン	OpenAI o1と同等の推論性能

フラッグシップモデルのKimi K2.5

Kimi K2.5は、シリーズの中で最も高い能力を持つモデルであり、K2をベースに約15兆個の視覚およびテキストトークンを用いて継続的な事前学習が行われました。このアーキテクチャは384名のエキスパートで構成され、1トークンにつき8名がアクティブ化される仕組みを採用しています。また、MLA（Multi-Latent Attention）やSwiGLU活性化関数を導入し、効率的な処理を実現しています。視覚面では、可変解像度入力を可能にするNaViTパッキングを活用した4億パラメータのビジョンエンコーダー「MoonViT-3D」を統合しています。

4つの運用モードの活用

K2.5は、ワークフローに合わせて最適化された4つの異なるモードで動作します。「K2.5 Instant」は単純な問い合わせに対して迅速に回答を生成し、「K2.5 Thinking」は複雑な問題に対して思考の連鎖（CoT）を有効にします。「K2.5 Agent」は単一のエージェントがツールを使用してタスクを完結させ、「K2.5 Agent Swarm」は最大100の特化型サブエージェントを並列で調整し、実行時間を大幅に短縮します。

モード	ユースケース	速度	推論の深さ
K2.5 Instant	クイックレスポンス、単純な作業	最速	標準的
K2.5 Thinking	数学、論理、複雑な分析	中速	深い思考の連鎖
K2.5 Agent	ツールの利用、コード実行、ブラウジング	タスクに依存	エージェント推論
K2.5 Agent Swarm	高度なリサーチ、多段階ワークフロー	単独エージェントより4.5倍高速	分散型マルチエージェント

ベンチマークによる性能評価

K2.5は数学的推論において AIME 2025で96.1％、MATH-500で98.0％、GPQA-Diamondで87.6％という高いスコアを記録しました。プログラミング分野のLiveCodeBench v6では83.1％を達成し、他社の主要モデルを大きく上回る性能を示しています。また、エージェントスウォームモードを活用することで、Humanity's Last Examにおいてツールを用いた場合に50.2％の正答率を記録し、高いコストパフォーマンスを実現しました。視覚性能においてもOCRBenchで92.3％、VideoMMMUで86.6％と、業界トップクラスの数値を維持しています。

基盤モデルのKimi K2

2025年7月に公開されたK2は、Moonshot AI初の1兆パラメータ級MoEモデルであり、その後のK2シリーズの技術的土台となりました。MITライセンスで提供されたこのモデルは、384エキスパートのうち32Bがアクティブ化される設計を確立しました。初期のリリースでは128Kトークンのコンテキストをサポートしていましたが、その後のアップデートにより、さらなる長文処理が可能となっています。

2025年9月に登場したK2-Instruct-0905では、プログラミング能力の強化と256Kトークンへのコンテキストウィンドウ拡張が行われました。このアップデート版はHumanEvalで94.5％という高い数値を達成し、堅牢なコード生成能力を証明しました。マルチモーダル機能を必要としないユーザーのために、現在もテキスト特化型の選択肢として提供されています。

軽量化された派生モデル

Kimi Linearの特性

2025年10月に発表されたKimi Linearは、総パラメータ数48B、有効パラメータ数3BのコンパクトなMoEアーキテクチャを採用しています。エッジデバイスでの運用やリソースの限られた環境向けに最適化されており、そのサイズからは想像できないほど高い性能を発揮します。128Kトークンのコンテキストに対応し、一般的なPCハードウェアでも効率的に動作するため、ローカル環境での開発や低遅延が重視されるモバイルアプリに適しています。

Kimi-VLの役割

2025年4月にリリースされたKimi-VLは、16Bパラメータ（有効3B）の視覚言語モデルです。Moonshot AI初のオープンソースマルチモーダルモデルとして、画像理解とテキスト生成を組み合わせるタスク向けに開発されました。最新のK2.5が備える高度な処理能力には及びませんが、1兆パラメータ級のモデルを動かすまでもない軽量な画像認識タスクにおいては、現在も非常に有用な選択肢です。

推論特化型のKimi K1.5

2025年1月リリースのK1.5は、Moonshot AIが高度な推論モデル市場に参入するきっかけとなった重要なモデルです。数学やコーディングのベンチマークにおいてOpenAIのo1モデルと同等の性能を主張し、強化学習に基づいた推論機能をプラットフォームに導入しました。正確なパラメータ数は公表されていませんが、最先端の推論能力を持つAIとしての地位を確立しました。

K1.5はテキストベースの推論に特化しており、マルチモーダル機能は備えていません。このモデルの成功が、後のK2シリーズ開発の重要な布石となりました。現在K1.5を利用しているユーザーに対しては、あらゆる指標で旧モデルを凌駕し、さらに視覚機能やエージェント機能を備えたK2.5への移行が推奨されています。

最適なKimiモデルの選び方

モデルの選定は、必要とされる処理能力、コスト、およびデプロイ環境の柔軟性に基づいて行う必要があります。以下のガイドラインを参考に、用途に合わせた最適な選択を行ってください。

最高の能力を求める汎用的なAI利用：APIまたは公式サイトを通じてK2.5を使用してください。簡易的なタスクはInstantモード、複雑な推論はThinkingモードが担います。
自律的なワークフローや調査業務：K2.5 AgentまたはAgent Swarmモードを活用してください。並列的な情報収集が必要な複数段階のタスクで威力を発揮します。
フル機能を備えた自前環境での運用：Hugging FaceからK2.5をダウンロードし、vLLMやDockerなどの環境を利用して独自のサーバーで実行してください。
軽量・エッジ環境での実行：リソース制限がある環境では、48BパラメータのKimi Linearを選択することで、限られたハードウェアでも十分な性能を得られます。
コストを抑えた単純な視覚タスク：K2.5ほどの高度な機能が不要な場合は、軽量なKimi-VLを利用することで効率的に画像処理を行えます。
低コストでのテキスト推論：視覚機能を必要とせず、1兆パラメータ級の推論力のみを求める場合は、K2-Instruct-0905が適しています。

よくある質問

どのKimiモデルが最も優れていますか？

性能面ではKimi K2.5が最も優れています。推論、プログラミング、視覚、エージェント機能のすべての項目でトップの数値を記録しており、AIME 2025で96.1％、LiveCodeBenchで83.1％という高いスコアを持っています。

Kimiモデルの使用価格はいくらですか？

2026年現在、すべてのKimiモデルは公式サイトやアプリを通じて無料で利用可能です。API経由のアクセスはトークンごとの課金制（K2.5は100万入力トークンあたり0.60ドル〜）となっています。Hugging Faceの重みデータも無料でダウンロード可能です。

Kimiモデルをローカルで実行できますか？

はい、K2.5とK2はHugging Face上でblock-fp8形式で配布されており、vLLMやDockerを使用してデプロイ可能です。ただし、1兆パラメータモデルには大規模なGPUリソースが必要です。個人環境にはKimi Linearが現実的です。

K2とK2.5の主な違いは何ですか？

K2.5にはネイティブなマルチモーダル機能と、最大100のエージェントを並列動作させるエージェントスウォームモードが追加されています。またコンテキストウィンドウもK2の128Kから256Kに拡張されています。

Kimi Linearはどのような用途に適していますか？

軽量設計のため、エッジデバイスでの運用やリソースの限られた環境、低遅延が重視されるモバイルアプリに適しています。一般的なPCハードウェアでも効率的に動作します。

Kimi K2.5のAPI料金は？

K2.5の場合、100万入力トークンあたり0.60ドルからとなっています。公式サイトやアプリからの直接利用は無料で可能です。

オープンソースとして利用できますか？

はい、K2.5やK2は修正MITライセンスのもとでオープンソースとして公開されており、商用利用も認められています。Hugging Faceを通じてアクセス可能です。

Kimi K1.5の特徴は何ですか？

K1.5はテキストベースの高度な推論に特化したモデルで、数学やコーディングにおいてOpenAIのo1と同等の性能を持ちますが、マルチモーダル機能は備えていません。

Kimi-VLの役割は何ですか？

16Bパラメータの軽量な視覚言語モデルで、1兆パラメータ級のモデルを必要としない画像理解とテキスト生成のタスクに最適です。

K2-Instruct-0905は何に特化していますか？

プログラミング能力の強化と256Kトークンのコンテキストに対応しており、視覚機能を必要としない場合のテキスト特化型高性能モデルとして機能します。