关闭广告

华为发布AI推理新技术 将于今年9月正式开源

财联社2025-08-13 12:00:014084人阅读

《科创板日报》8月12日讯(记者 黄心怡)华为今日发布AI推理创新技术UCM(推理记忆数据管理器)。作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。

据悉,华为计划于2025年9月正式开源UCM,届时将在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区,并共享给业内所有Share Everything(共享架构)存储厂商和生态伙伴。

IDC预测,到2027年中国智能算力中,推理算力占比将从2023年的41%左右上升到72.6%左右。中国信息通信研究院人工智能研究所平台与工程化部主任曹峰表示,大模型推理需求爆发。一方面大模型服务调用量、推理计算量将翻倍,另一方面大模型推理算力供给将超过训练,基础设施重心将逐步向推理偏移。

不过,当前AI推理应用落地过程中存在推不动、推得慢、推得贵等问题。华为数据存储产品线总裁周跃峰举例:中国互联网大模型的首Token时延普遍慢于海外互联网头部的首Token时延,海外头部大模型的推理吞吐率也要远高于中国。因此,如何改进推理系统的效率和体验是重要课题。这也是华为此次推出UCM推理记忆数据管理器的原因。

据介绍,UCM推理记忆数据管理器已经在中国银联的客户服务、营销策划、办公会议等业务场景中,开展AI推理加速应用试点。

华为数据存储产品线副总裁、闪存领域总裁谢黎明表示,从银行业来看,不管是生产环境的投研分析,还是舆情分

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

黑吃黑!骗走全球36亿的“币圈割王”,被精准猎杀

大猫财经Pro 浏览 232 11-12

完胜!林诗栋/蒯曼3-0林仲勋/申裕斌,瑞典大满贯混双夺冠

直播吧 浏览 428 08-23

乌加特:阿莫林总是说要注意沟通&团结一致,尽快夺回球权

直播吧 浏览 5952 07-27

韩剧女神,被吐槽“断崖式衰老”?

寻艺 浏览 261 01-23

呷哺呷哺上半年同比减亏7成,下半年继续发力会员经济、外卖业务

红星资本局 浏览 521 08-31

赖清德大罢免投票中被"剃光头" 学者揭其失败主因

海峡导报社 浏览 4699 07-28

郭晶晶就个人发展问题最新发声

新民周刊 浏览 358 10-18

基辅防空警报持续超5小时 一文读懂俄乌最新战况

央视新闻客户端 浏览 8944 06-08

俄乌战场惊现"丐帮打法" 俄无人机绑棍子捅落乌无人机

鲁中晨报 浏览 296 10-26

宇宙深处数百“小红点”身份曝光

网易科技报道 浏览 9969 07-31

苹果公开反对,欧盟委员会强硬回应

第一财经资讯 浏览 393 09-26

意媒:未过体检,马特塔交易告吹

体坛周报 浏览 238 02-03

深圳千亿双巨头杀疯了!大疆做全景、影石做无人机,针尖对麦芒?

雷科技 浏览 6788 07-29

斯塔默将访华:不学卡尼 中英关系不会激怒特朗普

澎湃新闻 浏览 254 01-28

24岁学生9字回应酷似大S 侧面捅破具俊晔龌龊心思

小丸子的娱乐圈 浏览 5559 08-05

地点未定 摩擦又起 美伊核谈判开启前变数频生

极目新闻 浏览 254 02-05

官方:步行者续约主帅卡莱尔;上赛季率队打进总决赛

懂球帝 浏览 542 08-20

罗马总监:不会和佩莱格里尼续约,目前还没有达到签约桑乔的条件

直播吧 浏览 527 08-24

看完《731》,心情很复杂

独立鱼 浏览 411 09-20

印度异想天开,万万没想到,中国早布天罗地网

浏览 9926 07-14

涉嫌网络侵权?坦克CEO常尧被比亚迪起诉了|封面关注

封面新闻 浏览 408 09-09
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11