刚刚,月之暗面扔出一颗深水炸弹。

2026年6月12日,Kimi正式发布并开源Kimi K2.7 Code编程模型。参数量1.1万亿,上下文窗口256K。更重要的是,这款模型终于解决了一个困扰行业很久的问题——AI在长程任务中的”过度思考”。

Token消耗直降30%。这意味着什么?意味着你让它写一个大型项目,它不会再先写10万字的”思考过程”再动笔,而是直接干活。

💡 Kimi选择在这个时间点开源一款编程模型,背景值得琢磨。GPT-5.5和Claude Opus 4.8已经在编程赛道形成压制,K2.7 Code的出现,是防守,也是试探。

一、1.1万亿参数背后:这次迭代解决什么问题

K2.7 Code不是大版本,而是一次精准的补丁。

前代K2.6的问题在于:长上下文场景下,模型的推理链路太长,每次处理复杂任务都会消耗大量Token。”想太多”导致成本高、速度慢,用户体验很差。

K2.7 Code的改进方向很明确:

💡 第一,降低Token消耗。 平均减少30%,不是通过压缩模型实现,而是优化推理路径。模型学会了在合适的时候”停止思考,直接动手”。

💡 第二,提升指令遵循能力。 编程任务往往有复杂的需求描述,K2.6在长程任务中容易丢失关键约束。K2.7 Code的指令遵循能力显著增强。

💡 第三,改善过度思考。 这是核心卖点。月之暗面在发布会上没有回避这个问题,甚至专门花大篇幅解释”什么是过度思考、为什么它会影响用户体验”。

💡 把问题坦诚说出来再解决,比PPT上写”性能大幅提升”要诚实得多。

二、基准测试:60分,距离GPT-5.5还有差距

配图1

发布会上最值得关注的细节是:月之暗面主动公布了与GPT-5.5和Opus 4.8的对比差距。

不是”我们超越了XXX”,而是”我们和顶级模型还有差距”。

具体数据:如果GPT-5.5和Opus 4.8在编程上做到70分,K2.6大约是50分,K2.7 Code提升到了60分以上。

这是一个诚实的分数。K2.7 Code在多项专业基准测试中表现如下:

基准测试 提升幅度
Kimi Code Bench v2 +21.8%
Program-Bench +11%
MLS Bench Lite +31.5%
Kimi Claw 24/7 Bench +10%
MCP Atlas +10%
MCP Mark Verified +10%

从50分到60分,进步是真实的。但月之暗面没有用”局部超越”的话术包装,而是把完整数据摊开。这种态度在国内AI圈不多见。

💡 Kimi选择在发布会上”坦白差距”,而不是用局部数据夸大宣传。这种做法在国产大模型中不多见,也正因为如此,反而更值得关注。

三、实测:做前端、搭”智能体小镇”,K2.7 Code表现如何

智东西第一时间进行了实测。

💡 测试一:macOS风格前端demo

任务是让K2.7 Code用单个HTML文件复刻一个macOS风格的操作系统demo,包含开机动画、便签、浏览器等基本功能。

结果:K2.7 Code的响应速度明显快于前代。模型”更果断”——在简单任务上不再反复自我质疑、长篇大论地思考然后再动手。由于生成耗时短,迭代速度也更快。

最终效果:demo完成度不错,开机动画、基本功能都能正常运行。不足的是SVG开机动画与苹果logo过于相似,多次要求修改后仍未有明显改善。

💡 测试二:”智能体小镇”开发

智能体小镇(Agent Town)是斯坦福大学与谷歌合作推出的多智能体交互实验项目。测试中,K2.7 Code先输出了一份PRD文档,包含产品定位、市场背景、功能架构、技术方案等细节。

然后在PRD指导下开发最小可行版本(MVP)。one-shot生成结果存在一些bug,画面无法正常渲染。经多次迭代优化,30分钟后交付了完整可用版本。接入大模型后可正常与智能体对话。

💡 AI编程模型的迭代速度正在无限逼近”人类程序员的速度”。当模型学会果断行动而非反复思考,效率提升是指数级的。

四、定价:和K2.6一致,高速版6月15日上线

K2.7 Code已上线Kimi API开放平台,定价与K2.6保持一致:

类型 价格
标准输入(1M token) 6.5元
标准输出(1M token) 27元
缓存命中输入 1.3元

Kimi Code Plan的默认模型已同步升级为K2.7 Code。值得注意的是,使用K2.7 Code必须开启思考模式。如果手动关闭思考模式,API会报错,Kimi Code会自动回退到K2.6。

这是一个有趣的设定:月之暗面认为K2.7 Code的最佳性能必须依赖思考模式。这也意味着,”无脑快”不是这款模型的追求,”聪明地快”才是。

💡 思考模式强制开启是一个明确的信号:K2.7 Code不是要取代K2.6,而是在编程这个细分场景做到极致。非编程任务,K2.6仍然是首选。

下周一(6月15日),Kimi K2.7 Code高速版将开放调用。输出速度约为普通版的5-6倍:

  • 常规编程场景:约180 Token/s
  • 短上下文场景:最高260 Token/s
  • 价格:普通版的2倍

这是一个明确的产品分层策略。普通版满足日常需求,高速版为高强度编程场景准备。

五、为什么月之暗面要开源这款模型

配图2

K2.7 Code是月之暗面第一次在编程模型上开源。

背后的逻辑值得思考。GPT-5.5和Opus 4.8已经在编程赛道建立了明确的优势,Kimi选择用开源的方式切入,是希望快速积累开发者生态和真实场景反馈。

开源的好处是双重的:

💡 第一,建立开发者信任。 开发者可以本地测试、可以验证基准数据、可以提出issue。这种透明度的回报是社区参与度。

💡 第二,加速能力迭代。 开源社区的反馈往往比内部测试更能暴露模型问题。月之暗面显然希望借助社区力量快速迭代K2.7 Code的能力边界。

💡 开源一款编程模型,本质上是在编程场景和OpenAI、Anthropic正面竞争。开发者生态的争夺,才是这场发布真正的战场。

六、K2.7 Code和K2.6怎么选

月之暗面给了一个很清晰的使用指南:

  • 💡 编程任务、Agent任务 → 选K2.7 Code
  • 💡 非编程的综合任务 → 选K2.6

这两款模型不是替代关系,而是分工关系。K2.6是全能型选手,K2.7 Code是编程赛道的专项选手。

如果你主要用Kimi处理文案、问答、分析等任务,K2.6仍然是主力。如果你从事软件开发、需要处理复杂的长程编程任务,K2.7 Code会带来明显的效率提升。

💡 术业有专攻,大模型也在走向专业化。K2.7 Code的出现,是大模型从”通用”走向”垂直”的一个缩影。

七、K3才是今年的重头戏

发布会上有一个容易被忽略的细节:月之暗面透露,K3才是今年的重头戏。

K2.7 Code是一次精准的补丁迭代,目标是巩固编程赛道的既有优势。而K3的提升”将会很明显”,目标是与GPT-5.5、Opus 4.8正面竞争。

从50分到60分,K2.7 Code用了不到一年。K3能否突破70分,决定了国产大模型能否真正站上编程赛道的顶峰。

八、国产大模型的”坦诚时刻”

配图3

整场发布会最值得记录的不是K2.7 Code的参数或基准数据,而是一种态度。

月之暗面没有找某个评测项目去证明自己”超越了GPT-5.5″。相反,他们主动公布了差距,解释了原因,展示了目标。

这种坦诚在国内AI圈并不常见。很多公司发布大模型,喜欢挑一两个评测项目证明自己”全球领先”,但真实能力如何,只有自己知道。

Kimi的选择是:承认差距,然后努力追赶。

💡 Kimi这场发布会的真正价值,不在于K2.7 Code本身,而在于它示范了一种可能的路径:与其在PPT上超越,不如在产品上逼近。

九、参考资料

  • Kimi官方发布公告(2026年6月12日)
  • 智东西实测报道(2026年6月12日)
  • 快科技《国产大模型Kimi 2.7 Code发布》(2026年6月12日)
  • 太平洋电脑网《Kimi K2.7 Code高速版即将上线》(2026年6月12日)
  • IT之家《月之暗面开源Kimi K2.7 Code编程模型》(2026年6月12日)