月之暗面发布万亿参数模型Kimi K2

界面新闻记者 | 伍洋宇
界面新闻编辑 | 文姝琪

7月11日晚，月之暗面突然发布重要更新，正式推出Kimi K2模型并同步开源。

K2采用MoE架构，总参数达到1T，激活参数为32B。相较过去的基座模型，K2更强调代码能力和通用Agent任务能力。

在SWE Bench Verified、Tau2、AceBench等基准性能测试中，K2达到开源模型SOTA表现。

其中，K2在SWE-bench Verified和SWE-bench Multilingual两项自主编程能力的测试上，成绩仅次于Claude 4 Opus和Claude 4 Sonnet，优于DeepSeek-V3-0324、Qwen3-235B-A22B以及OpenAI GPT-4.1。

在两项工具调用能力测试中，K2分别逼近位居第一的OpenAI和Anthropic。

为展现其代码能力提升，Kimi在演示中通过一段“创建3D HTML山脉场景”的提示词，生成了山川峡谷的3D景观，包含悬崖、河流和昼夜光照变化等元素，支持粒子系统、可视化和3D场景等表现形式。

Agent能力方面，月之暗面表示Kimi K2现已可稳定拆解复杂指令，尤其展示了在长上下文能力（13万行原始数据）支撑下，对冗杂内容的准确分析能力。

月之暗面强调，K2将作为通用Agent能力的基础，未来计划加入更高级的思考和视觉理解能力。

目前，月之暗面已在官网和Kimi App中上线K2模型。它也展现出更多的开放性，在上线API服务的同时（支持最长128K上下文），提供兼容OpenAI和Anthropic的Chat API接口，表示前两者的用户可以在Coding和Agent功能上体验K2的能力。

定价方面，K2每百万输入tokens/4 元；每百万输出tokens/16 元。

就行业影响力而言，Kimi K2可能是DeepSeek年初在全球狂扫一波关注度之后，月之暗面最重要的一次发布。彼时面对DeepSeek的异军突起，有AI行业从业人士对界面新闻记者表示，Kimi如若想要再度回到舞台中央，需要贡献出有同等量级的技术创新表现。

Kimi内部或许也是对K2如此定位的。一名与Kimi方面有合作的知情人士告诉界面新闻记者，过去一段时间，Kimi工作人员多次表示近期会有“大动作”。在Kimi K2发布的当晚，其联合创始人张宇韬在朋友圈转发文章时直言，“Make Kimi Great Again”。

相比起2024年在行业风生水起的Kimi，它在今年上半年的确一改风格，变得出奇的低调。至于它是否真的做到了“悄悄惊艳所有人”，行业中暂且说法不一。

从目前已经流出的评测来看，K2在Agent任务规划上还是有不够好用的地方，但在产品和模型层面，Kimi要奋起直追的姿态非常鲜明。事实上，在K2之前，Kimi还发布了自己的Deep Research功能，比肩OpenAI和谷歌Gemini的同类产品，并且在马斯克的xAI Grok 4发布会上被提及。

一名AI大模型投资人给出了更客观的评价，他对界面新闻记者表示，Kimi K2是完成度很不错的产品，但惊艳程度的确不及DeepSeek。

在用户层面，Kimi K2要将自己的体验升级之处向C端（用户）市场传达到位并不容易，因为普通用户大多难以直观感知基座模型的Agentic能力。这意味着它的影响力量级有限。

至于资本层面，这名投资人表示，下半年市场还将迎来几款重要的国产模型，投资人其实普遍已经更有耐心。

还没有评论，来说两句吧...