【#月之暗面罕见回应一切#:打假460万美元、调侃OpenAI】昨天凌晨,月之暗面核心团队在社交媒体平台 Reddit 上举行了一场有问必答(AMA)活动,月之暗面联合创始人兼 CEO 杨植麟等人在 Kimi K2 Thinking 模型发布后不久,正面回应了模型训练成本、跑分与实际体验差距等热点议题。
Kimi K2 Thinking 模型训练成本仅为 460 万美元的网络传言喊得响亮,不过,杨植麟已经打假了,他称,这并非官方数据,训练成本很难量化,因为其中很大一部分用于研究和实验。他还透露,月之暗面已经在研究 K2 的 VL(视觉-语言)版本了。
有不少海外网友提出了十分尖锐的问题,比如 Kimi K2 Thinking 的推理长度过长,榜单成绩与实际体验不符等问题。杨植麟解释了背后的原因,他称现阶段该模型优先考虑绝对性能,token 效率会在后续得到改善。榜单高分与实测的脱节,也会在模型通用能力补齐后获得改善。
10 月底,月之暗面开源了混合线性注意力架构 Kimi Linear,首次在短上下文、长上下文、强化学习扩展机制等各种场景中超越了全注意力机制,引来不少开发者关注。杨植麟称,Kimi Linear 的 KDA 混合线性注意力模块,很可能会以某种形式出现在 K3 中。
而当网友问及 K3 的发布时间时,杨植麟戏谑地回应道:“在 Sam 价值万亿美元的数据中心建成之前。”
月之暗面团队似乎还在另外几条评论中调侃了 OpenAI。当网友问及有无 AI 浏览器的开发计划时,月之暗面联合创始人兼算法团队负责人周昕宇称,要做出更好的模型,并不需要再去套一层新的 Chromium 壳。而当网友好奇 OpenAI 为何要烧掉那么多钱时,周昕宇称:“这个问题只有 Sam 才知道。我们有自己的方式和节奏。”
面对外界关于“开源是否会带来安全风险”的提问,杨植麟回应称,开放安全对齐技术栈有助于更多研究者在微调开源模型时保持安全性,同时他也强调需要建立机制,确保这些后续工作遵循安全协议。
他还在另一条评论中补充道:“我们拥抱开源,因为我们相信对 AGI(通用人工智能)的追求,应该带来团结,而不是分裂。”
月之暗面联合创始人吴育昕也一同参与了这场问答,杨植麟、周昕宇、吴育昕围绕 Kimi 系列模型的架构创新、训练细节、开源策略以及未来规划与网友进行了交流。



发布于:北京
相关推荐
罕见!月之暗面杨植麟、周昕宇、吴育昕回应一切:打假460万美元、调侃OpenAI
罕见,月之暗面杨植麟、周昕宇、吴育昕回应一切:打假460万美元、调侃OpenAI
DeepSeek风暴里的月之暗面
月之暗面反割阿里一把?
执行人士回应月之暗面收缩出海:海外项目没正式立项
月之暗面回应大模型称9.11大于9.9:边界案例有助于我们增加对大模型能力边界的了解
月之暗面创始团队持股不足半,为何他们不担心?
月之暗面卷入仲裁漩涡,都是利益惹的祸?
月之暗面出海收缩,相关产品负责人离职创业
月之暗面创始人杨植麟被前投资人发起仲裁 代理律师称将提出抗辩
网址: 月之暗面回应K2模型成本质疑,透露K3研发进展 http://m.xishuta.com/newsview144268.html