界面新闻记者 |
界面新闻编辑 | 文姝琪
7月11日晚,月之暗面突然发布重要更新,正式推出Kimi K2模型并同步开源。
K2采用MoE架构,总参数达到1T,激活参数为32B。相较过去的基座模型,K2更强调代码能力和通用Agent任务能力。
在SWE Bench Verified、Tau2、AceBench等基准性能测试中,K2达到开源模型SOTA表现。
其中,K2在SWE-bench Verified和SWE-bench Multilingual两项自主编程能力的测试上,成绩仅次于Claude 4 Opus和Claude 4 Sonnet,优于DeepSeek-V3-0324、Qwen3-235B-A22B以及OpenAI GPT-4.1。
在两项工具调用能力测试中,K2分别逼近位居第一的OpenAI和Anthropic。

为展现其代码能力提升,Kimi在演示中通过一段“创建3D HTML山脉场景”的提示词,生成了山川峡谷的3D景观,包含悬崖、河流和昼夜光照变化等元素,支持粒子系统、可视化和3D场景等表现形式。
Agent能力方面,月之暗面表示Kimi K2现已可稳定拆解复杂指令,尤其展示了在长上下文能力(13万行原始数据)支撑下,对冗杂内容的准确分析能力。
月之暗面强调,K2将作为通用Agent能力的基础,未来计划加入更高级的思考和视觉理解能力。
目前,月之暗面已在官网和Kimi App中上线K2模型。它也展现出更多的开放性,在上线API服务的同时(支持最长128K上下文),提供兼容OpenAI和Anthropic的Chat API接口,表示前两者的用户可以在Coding和Agent功能上体验K2的能力。
定价方面,K2每百万输入tokens/4 元;每百万输出tokens/16 元。
就行业影响力而言,Kimi K2可能是DeepSeek年初在全球狂扫一波关注度之后,月之暗面最重要的一次发布。彼时面对DeepSeek的异军突起,有AI行业从业人士对界面新闻记者表示,Kimi如若想要再度回到舞台中央,需要贡献出有同等量级的技术创新表现。
Kimi内部或许也是对K2如此定位的。一名与Kimi方面有合作的知情人士告诉界面新闻记者,过去一段时间,Kimi工作人员多次表示近期会有“大动作”。在Kimi K2发布的当晚,其联合创始人张宇韬在朋友圈转发文章时直言,“Make Kimi Great Again”。
相比起2024年在行业风生水起的Kimi,它在今年上半年的确一改风格,变得出奇的低调。至于它是否真的做到了“悄悄惊艳所有人”,行业中暂且说法不一。
从目前已经流出的评测来看,K2在Agent任务规划上还是有不够好用的地方,但在产品和模型层面,Kimi要奋起直追的姿态非常鲜明。事实上,在K2之前,Kimi还发布了自己的Deep Research功能,比肩OpenAI和谷歌Gemini的同类产品,并且在马斯克的xAI Grok 4发布会上被提及。
一名AI大模型投资人给出了更客观的评价,他对界面新闻记者表示,Kimi K2是完成度很不错的产品,但惊艳程度的确不及DeepSeek。
在用户层面,Kimi K2要将自己的体验升级之处向C端(用户)市场传达到位并不容易,因为普通用户大多难以直观感知基座模型的Agentic能力。这意味着它的影响力量级有限。
至于资本层面,这名投资人表示,下半年市场还将迎来几款重要的国产模型,投资人其实普遍已经更有耐心。
还没有评论,来说两句吧...