小米旗下 MiMo 团队最近把 MiMo Code 开源了。这套框架的思路是:用你手上最强的模型审代码、写计划,然后交给更便宜的模型去执行。听起来是个很实际的方向——把推理预算按任务复杂度分层,而不是一刀切全走大模型。
核心流程大概是这样的:
- 最强模型(比如 GPT-5 / Claude Opus)先通读 codebase,理解项目结构、业务逻辑、安全约束
- 它产出一份结构化的执行计划,包含变更范围、测试要求、回滚条件
- 然后交给 7B~70B 级别的模型分段执行,每段独立验证
- 最后汇总、做冲突检查、出 PR
这套流水线的部署价值在于:不用每次小修改都调用最贵的模型。日常 bugfix、重构、小 feature 可以用中间层模型跑,只有架构级变更才动大模型。
GitHub 仓库已经开放,项目叫 XiaomiMiMo/MiMo-Code。目前支持 GitHub Actions 集成和本地 CLI 两种运行方式。
内容来源:小米 MiMo 官方博客和开发者文档
项目地址:XiaomiMiMo/MiMo-Code on GitHub
5 个赞
如果 MiMo Code 能跟 Langfuse 或 Helicone 这类 observability 工具打通,效果评估就清楚了——可以对比纯 gpt-5 和 MiMo 分层方案在实际 PR 上的通过率和误报率。
成本上最大的变量是 plan 的 token 长度。如果大模型写的 plan 本身就很长,省下的钱可能被 plan 开销吃掉了。
还有个角度:MiMo Code 的多模型分层跟最近流行的 Router + Fallback 架构是同一个方向。未来部署栈里可能标配多个模型各司其职。
对团队来说最大的门槛可能是信任——愿意把代码库里的一部分审计权交给 MiMo Code 的底层模型。需要一个渐进式 adoption 路线:先 scope 到单模块、低风险变更。
这个模式其实跟 Anthropic 之前提的"Compute Budgeting"有点像——把推理预算分配到不同复杂度的任务上。问题是怎么准确判断一个请求该走大模型还是小模型。
看了下 GitHub 仓库,计划输出格式是 JSON-based 的 instruction block。如果 downstream 能直接 parse 成 git commit / PR review,CI 集成就有戏。
MiMo Code 的思路是把最强模型当"架构师"用,弱模型当"流水线"执行。关键是 plan 格式要稳定,不然 cheaper model 解析会跑偏。