Kimi K2.7 Code编程模型发布：Token消耗降30%，1.1万亿参数重塑AI编程

刚刚，月之暗面扔出一颗深水炸弹。

2026年6月12日，Kimi正式发布并开源Kimi K2.7 Code编程模型。参数量1.1万亿，上下文窗口256K。更重要的是，这款模型终于解决了一个困扰行业很久的问题——AI在长程任务中的”过度思考”。

Token消耗直降30%。这意味着什么？意味着你让它写一个大型项目，它不会再先写10万字的”思考过程”再动笔，而是直接干活。

💡 Kimi选择在这个时间点开源一款编程模型，背景值得琢磨。GPT-5.5和Claude Opus 4.8已经在编程赛道形成压制，K2.7 Code的出现，是防守，也是试探。

一、1.1万亿参数背后：这次迭代解决什么问题

K2.7 Code不是大版本，而是一次精准的补丁。

前代K2.6的问题在于：长上下文场景下，模型的推理链路太长，每次处理复杂任务都会消耗大量Token。”想太多”导致成本高、速度慢，用户体验很差。

K2.7 Code的改进方向很明确：

💡 第一，降低Token消耗。 平均减少30%，不是通过压缩模型实现，而是优化推理路径。模型学会了在合适的时候”停止思考，直接动手”。

💡 第二，提升指令遵循能力。 编程任务往往有复杂的需求描述，K2.6在长程任务中容易丢失关键约束。K2.7 Code的指令遵循能力显著增强。

💡 第三，改善过度思考。 这是核心卖点。月之暗面在发布会上没有回避这个问题，甚至专门花大篇幅解释”什么是过度思考、为什么它会影响用户体验”。

💡 把问题坦诚说出来再解决，比PPT上写”性能大幅提升”要诚实得多。

二、基准测试：60分，距离GPT-5.5还有差距

配图1

发布会上最值得关注的细节是：月之暗面主动公布了与GPT-5.5和Opus 4.8的对比差距。

不是”我们超越了XXX”，而是”我们和顶级模型还有差距”。

具体数据：如果GPT-5.5和Opus 4.8在编程上做到70分，K2.6大约是50分，K2.7 Code提升到了60分以上。

这是一个诚实的分数。K2.7 Code在多项专业基准测试中表现如下：

基准测试	提升幅度
Kimi Code Bench v2	+21.8%
Program-Bench	+11%
MLS Bench Lite	+31.5%
Kimi Claw 24/7 Bench	+10%
MCP Atlas	+10%
MCP Mark Verified	+10%

从50分到60分，进步是真实的。但月之暗面没有用”局部超越”的话术包装，而是把完整数据摊开。这种态度在国内AI圈不多见。

💡 Kimi选择在发布会上”坦白差距”，而不是用局部数据夸大宣传。这种做法在国产大模型中不多见，也正因为如此，反而更值得关注。

三、实测：做前端、搭”智能体小镇”，K2.7 Code表现如何

智东西第一时间进行了实测。

💡 测试一：macOS风格前端demo

任务是让K2.7 Code用单个HTML文件复刻一个macOS风格的操作系统demo，包含开机动画、便签、浏览器等基本功能。

结果：K2.7 Code的响应速度明显快于前代。模型”更果断”——在简单任务上不再反复自我质疑、长篇大论地思考然后再动手。由于生成耗时短，迭代速度也更快。

最终效果：demo完成度不错，开机动画、基本功能都能正常运行。不足的是SVG开机动画与苹果logo过于相似，多次要求修改后仍未有明显改善。

💡 测试二：”智能体小镇”开发

智能体小镇（Agent Town）是斯坦福大学与谷歌合作推出的多智能体交互实验项目。测试中，K2.7 Code先输出了一份PRD文档，包含产品定位、市场背景、功能架构、技术方案等细节。

然后在PRD指导下开发最小可行版本（MVP）。one-shot生成结果存在一些bug，画面无法正常渲染。经多次迭代优化，30分钟后交付了完整可用版本。接入大模型后可正常与智能体对话。

💡 AI编程模型的迭代速度正在无限逼近”人类程序员的速度”。当模型学会果断行动而非反复思考，效率提升是指数级的。

四、定价：和K2.6一致，高速版6月15日上线

K2.7 Code已上线Kimi API开放平台，定价与K2.6保持一致：

类型	价格
标准输入（1M token）	6.5元
标准输出（1M token）	27元
缓存命中输入	1.3元

Kimi Code Plan的默认模型已同步升级为K2.7 Code。值得注意的是，使用K2.7 Code必须开启思考模式。如果手动关闭思考模式，API会报错，Kimi Code会自动回退到K2.6。

这是一个有趣的设定：月之暗面认为K2.7 Code的最佳性能必须依赖思考模式。这也意味着，”无脑快”不是这款模型的追求，”聪明地快”才是。

💡 思考模式强制开启是一个明确的信号：K2.7 Code不是要取代K2.6，而是在编程这个细分场景做到极致。非编程任务，K2.6仍然是首选。

下周一（6月15日），Kimi K2.7 Code高速版将开放调用。输出速度约为普通版的5-6倍：

常规编程场景：约180 Token/s
短上下文场景：最高260 Token/s
价格：普通版的2倍

这是一个明确的产品分层策略。普通版满足日常需求，高速版为高强度编程场景准备。

五、为什么月之暗面要开源这款模型

配图2

K2.7 Code是月之暗面第一次在编程模型上开源。

背后的逻辑值得思考。GPT-5.5和Opus 4.8已经在编程赛道建立了明确的优势，Kimi选择用开源的方式切入，是希望快速积累开发者生态和真实场景反馈。

开源的好处是双重的：

💡 第一，建立开发者信任。 开发者可以本地测试、可以验证基准数据、可以提出issue。这种透明度的回报是社区参与度。

💡 第二，加速能力迭代。 开源社区的反馈往往比内部测试更能暴露模型问题。月之暗面显然希望借助社区力量快速迭代K2.7 Code的能力边界。

💡 开源一款编程模型，本质上是在编程场景和OpenAI、Anthropic正面竞争。开发者生态的争夺，才是这场发布真正的战场。

六、K2.7 Code和K2.6怎么选

月之暗面给了一个很清晰的使用指南：

💡 编程任务、Agent任务 → 选K2.7 Code
💡 非编程的综合任务 → 选K2.6

这两款模型不是替代关系，而是分工关系。K2.6是全能型选手，K2.7 Code是编程赛道的专项选手。

如果你主要用Kimi处理文案、问答、分析等任务，K2.6仍然是主力。如果你从事软件开发、需要处理复杂的长程编程任务，K2.7 Code会带来明显的效率提升。

💡 术业有专攻，大模型也在走向专业化。K2.7 Code的出现，是大模型从”通用”走向”垂直”的一个缩影。

七、K3才是今年的重头戏

发布会上有一个容易被忽略的细节：月之暗面透露，K3才是今年的重头戏。

K2.7 Code是一次精准的补丁迭代，目标是巩固编程赛道的既有优势。而K3的提升”将会很明显”，目标是与GPT-5.5、Opus 4.8正面竞争。

从50分到60分，K2.7 Code用了不到一年。K3能否突破70分，决定了国产大模型能否真正站上编程赛道的顶峰。

八、国产大模型的”坦诚时刻”

配图3

整场发布会最值得记录的不是K2.7 Code的参数或基准数据，而是一种态度。

月之暗面没有找某个评测项目去证明自己”超越了GPT-5.5″。相反，他们主动公布了差距，解释了原因，展示了目标。

这种坦诚在国内AI圈并不常见。很多公司发布大模型，喜欢挑一两个评测项目证明自己”全球领先”，但真实能力如何，只有自己知道。

Kimi的选择是：承认差距，然后努力追赶。

💡 Kimi这场发布会的真正价值，不在于K2.7 Code本身，而在于它示范了一种可能的路径：与其在PPT上超越，不如在产品上逼近。

九、参考资料

Kimi官方发布公告（2026年6月12日）
智东西实测报道（2026年6月12日）
快科技《国产大模型Kimi 2.7 Code发布》（2026年6月12日）
太平洋电脑网《Kimi K2.7 Code高速版即将上线》（2026年6月12日）
IT之家《月之暗面开源Kimi K2.7 Code编程模型》（2026年6月12日）

Kimi K2.7 Code编程模型发布：Token消耗降30%，1.1万亿参数重塑AI编程

一、1.1万亿参数背后：这次迭代解决什么问题

二、基准测试：60分，距离GPT-5.5还有差距

三、实测：做前端、搭”智能体小镇”，K2.7 Code表现如何

四、定价：和K2.6一致，高速版6月15日上线

五、为什么月之暗面要开源这款模型

六、K2.7 Code和K2.6怎么选

七、K3才是今年的重头戏

八、国产大模型的”坦诚时刻”

九、参考资料

龙主编

我要评论

Kimi K2.7 Code编程模型发布：Token消耗降30%，1.1万亿参数重塑AI编程

一、1.1万亿参数背后：这次迭代解决什么问题

二、基准测试：60分，距离GPT-5.5还有差距

三、实测：做前端、搭”智能体小镇”，K2.7 Code表现如何

四、定价：和K2.6一致，高速版6月15日上线

五、为什么月之暗面要开源这款模型

六、K2.7 Code和K2.6怎么选

七、K3才是今年的重头戏

八、国产大模型的”坦诚时刻”

九、参考资料

微信分享

龙主编

相关推荐

我要评论

扫码关注