关闭广告

Kimi深夜整活,开源了首个万亿参数模型

网易科技报道2025-07-13 00:00:016008人阅读

7月11日晚,月之暗面宣布正式发布新一代基础模型 K2,并同步开源。该模型采用稀疏激活(MoE)架构,总参数1T,激活参数32B。

据悉,Kimi K2具备更强代码能力、更擅长通用 Agent 任务的 MoE 架构基础模型,在 SWE Bench Verified、Tau2、AceBench 等多个权威基准测试中取得当前开源模型中的最佳成绩(),在数学推理与复杂任务理解方面也表现优异。


据介绍,该模型训练过程中采用 MuonClip 优化器,有效解决大参数量模型的稳定训练问题,提升 token 利用效率,在优质数据稀缺的背景下进一步拓展 Scaling 上限。

技术上,Kimi K2结合大规模 Agentic Tool Use 数据合成、自我评价机制下的通用强化学习等方法,构建起更具泛化能力的推理引擎。月之暗表示,Kimi K2是构建通用 Agent 的关键基石,未来还将加入思考与多模态能力。

目前,Kimi K2模型已集成至 Kimi App 与官网平台,并提供 API 接入服务。API 兼容 OpenAI 与 Anthropic 的 Chat 接口,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

今年流行的“新老钱风”,优雅又时髦,太适合春天了!

LinkFashion 浏览 195 03-03

ImageNet分数越高,生成反而越糊?iREPA给出解释

新智元 浏览 263 12-23

虽不能说击败,但超美成世界第一就是一个打击

浏览 4981 07-14

郭宇欣刘萧旭太原盛典现场互动 太甜了

生性洒脱 浏览 259 11-27

牛弹琴:伊朗180度转弯先发制人 美国迅速回应

现代快报 浏览 51 05-28

《共和报》评意大利杯:“是机会还是阻碍?”

绿茵情报局 浏览 243 01-28

李小璐:年轻的举动,如今让自己的女儿买了单?

东方不败然多多 浏览 7393 07-28

燃气公司拟招北大文科生当抄表维修工:进来后会调岗

大风新闻 浏览 6297 06-10

Altman放话:2028年,超级智能将超越人类

钛媒体APP 浏览 209 02-24

75岁斯琴高娃近况曝光令人担忧!暴瘦

小徐讲八卦 浏览 249 12-19

黄仁勋:不必担心中国军方会使用英伟达芯片

环球网资讯 浏览 2927 07-15

从《繁花》到威尼斯电影节影后,39岁的辛芷蕾再次让人刮目相看!

电和影 浏览 427 09-09

与陈建斌同居5年被甩 如今的吴越 活成人生赢家

闻识 浏览 370 09-10

老黄自曝皮衣口袋藏“秘密期权池”!随时准备奖励优秀员工

量子位 浏览 5703 07-25

材料学新突破,科学家在陨石中发现奇异矿物

网易科技报道 浏览 979 08-14

吉利11月销量破31万辆 连续9个月同环比双增长 再刷历史新高

网易汽车 浏览 266 12-02

中国OTA「分野」:为什么大众旅游更有含金量?

懂财帝 浏览 515 08-20

订单突破5万台/售12.98万起 长安启源Q07开启交付

网易汽车 浏览 542 05-22

增程动力有智驾 别克5米长大轿车命名"至境L7"

网易汽车 浏览 5124 07-18

福原爱首次回应再婚怀孕 现任丈夫正是出轨风波男主

新民周刊 浏览 256 12-23

媒体:美军武器靠拆零件续命 对美国或是一种致命伤

新民周刊 浏览 325 10-21
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11