MiMo Code公開長期タスク向けOSSエージェント

Xiaomiがターミナル向けAIコーディングエージェント「MiMo Code」をMITライセンスで公開しました。長時間の開発作業でエージェントが文脈を失う問題に、専用のメモリ機構で対処する設計が特徴です。

この記事では、MiMo Codeの公開内容と技術設計、Claude Codeとの比較結果、導入方法を整理します。

この記事でわかること

MiMo Code v0.1.0の概要とOpenCodeとの関係
4層メモリとcheckpoint-writerによる長期タスク対応
Xiaomiが公表したベンチマークと社内評価の結果
インストール手順とClaude Codeからの移行方法

MiMo Codeとは

MiMo Codeは、XiaomiのMiMo AIチームが2026年6月10日に公開したターミナルネイティブのAIコーディングエージェントです。バージョンはv0.1.0で、オープンソースのコーディングエージェント「OpenCode」をフォークし、メモリ機構・ワークフロー・モデル連携を独自に拡張しています。

ターミナル上でファイルの読み書き、コマンド実行、Git操作を行います。OpenCodeが持つ複数プロバイダー対応、TUI、LSP、MCP、プラグイン機能はそのまま継承し、セッションをまたいだ記憶保持と自己改善機能を追加した形です。

なぜ長期タスク向けの設計が必要か

コーディングエージェントは、会話履歴をコンテキストウィンドウに載せて動きます。短いタスクではこの方式で十分ですが、数十〜数百ステップに及ぶ作業では、ツール出力やエラーログでウィンドウが埋まり、過去の判断や規約が圧縮・消失します。

Xiaomiの技術ブログでは、「より良い圧縮」ではなく「何を永続化し、いつ呼び出すかを決める明示的な保存・検索機構」が必要だと指摘しています（参考）。MiMo Codeはこの課題を、ランタイム側のメモリ設計で解く方針です。

4層メモリとcheckpoint-writer

MiMo Codeの中核は、SQLite FTS5全文検索を使ったクロスセッション・メモリです。4つの層で情報を管理します。

プロジェクトメモリ（MEMORY.md）: アーキテクチャ判断やユーザー規約など、プロジェクト単位の永続知識
セッションチェックポイント（checkpoint.md）: 現在のセッション作業状態
スクラッチノート（notes.md）: エージェント用の一時メモ
タスク進捗（tasks/<id>/progress.md）: タスクごとのログ

メインのコーディングエージェントに記録を任せるのではなく、独立した「checkpoint-writer」サブエージェントが並行して状態を書き出します。メインエージェントは作業を続け、ライターが11項目の構造化ファイル（現在の意図、次のアクション、タスクツリー、関与ファイルなど）を更新します。

コンテキスト使用率が20%、45%、70%の地点でチェックポイントが走り、上限に近づくと永続ファイルから作業文脈を再構築します。再注入の合計はおおよそ65Kトークンに抑え、モデルから見れば会話が途切れていない状態を保ちます。

さらに/dreamは約7日ごとに過去セッションを整理し長期メモリへ圧縮、/distillは約30日ごとに繰り返しワークフローをスキルやコマンドへ固めます。

ベンチマークと実利用評価

Xiaomiが公表したオフラインベンチマークでは、MiMo Code＋MiMo-V2.5-ProがClaude Code＋Claude Sonnet 4.6を上回ると報告されています（参考）。

ベンチマーク	MiMo Code	Claude Code
SWE-bench Verified	82%	79%
SWE-bench Pro	62%	55%
Terminal Bench 2	73%	69%

同一モデルMiMo-V2.5-Proを両ハーネスで動かした場合、SWE-bench Proで62%対57%、Terminal Bench 2で73%対68%となり、ハーネス単体で約5ポイントの差が出たとしています。

社内ベータでは576人の開発者・474の非公開リポジトリで二重盲検A/B評価を実施し、1,213組の勝敗判定を集計しました。実行ステップが200未満では勝率はほぼ50%対50%ですが、200ステップ超ではMiMo Codeの勝率が65%を超えたと報告されています。

これらはいずれもベンダー自己申告の数値で、MiMo Codeは公式リーダーボード未掲載です。VentureBeatの報道では、Terminal-Bench 2.0の公式リーダーボードではOpenAI Codex CLI＋GPT-5.5が82.2%を記録しており、MiMo Codeの73%を上回る点にも触れています（参考）。評価条件の違いを踏まえた解釈が必要です。

主な機能

エージェントモードは3種類です。buildがデフォルトの開発モード、planが読み取り専用の分析、composeが仕様駆動のオーケストレーションです。Tabキーで切り替えます。

サブエージェントはメインエージェントが必要に応じて生成し、並列実行・キャンセル・バックグラウンド実行に対応します。/goalコマンドでは停止条件を設定し、独立した判定モデルが完了を検証します。

音声入力はMiMo ASRとTenVADを使い、ログインユーザーが/voiceで利用できます。

Claude Codeからの移行では、MCPサーバー、カスタムスキル、API設定を自動インポートできます。

インストールとモデル連携

macOS・Linuxでは次の1行で導入できます。

curl -fsSL https://mimo.xiaomi.com/install | bash

Windowsはnpm install -g @mimo-ai/cliです。初回起動時にモデル接続方法を選びます。

MiMo Auto: 期間限定無料。MiMo-V2.5（100万トークンコンテキスト）を設定不要で利用
Xiaomi MiMo Platform: OAuthログイン
Claude Codeからインポート: 既存認証を移行
カスタムプロバイダー: OpenAI互換APIを追加

MiMo-V2.5は総パラメータ310B・推論時15BアクティブのスパースMoE、MiMo-V2.5-Proは1.02T総・42Bアクティブです。API料金はV2.5が入力$0.40/100万トークン・出力$2.00/100万トークン、V2.5-Proが入力$1.00・出力$3.00（256K以下）と、フロンティアモデルの中では低価格帯に位置します。

DeepSeek、MoonshotのKimi、ZhipuのGLMなど第三者バックエンドや、任意のOpenAI互換APIにも接続できます。

Claude Codeとの違い

観点	MiMo Code	Claude Code
ライセンス	MIT（ソース改変・商用利用可）	プロプライエタリ
ベース	OpenCodeフォーク	Anthropic独自
長期メモリ	4層＋checkpoint-writer	コンテキスト圧縮中心
デフォルトモデル	MiMo-V2.5（期間限定無料）	Claude Sonnet系
成熟度	v0.1.0	本番利用実績あり

Claude CodeはAnthropicエコシステムとの統合が強みです。MiMo CodeはOSSとして中身を検証でき、自社承認のAPIエンドポイントへ向けられる点が企業評価では利点になります。一方、期間限定無料のMiMo Autoはコード文脈がXiaomiのサーバーを経由するため、データ所在地やIP保護の要件が厳しい組織には不向きです。

導入を検討する際の視点

MiMo Codeは公開から間もないv0.1.0です。GitHubでは公開直後から注目を集め、リリースv0.1.0のバイナリは各プラットフォームで数万回規模のダウンロードが記録されています。

長期タスク向けのメモリ設計は、エージェント型コーディングの実務課題に直結する領域です。ハーネス（エージェントを包む実行基盤）の設計が、モデル性能と同等に成果を左右する流れの中で、Xiaomiがスマートフォン大手からターミナルエージェント市場に参入した点は注目に値します。

まずは非公開リポジトリで試し、ベンチマーク数値より200ステップ超の実タスクでの挙動を確認するのが現実的です。MiMo Autoの無料期間や利用規約の変更にも留意してください。