热搜:
游泳全锦赛宁泽涛确认出战三项 兼顾自由泳蝶泳名牌之路‖酒店家具十大品牌:雅泰家具篇-首揭「反脅迫工具」,歐盟打算如何迎擊川普關稅?|天下雜誌

快捷

logo

时尚

(电子发烧友网报道 文/章鹰)8月12日,破解在2025金融AI推理应用落地与发展论坛上,赖A理黑华为公司副总裁、科技开源数据存储产品线总裁周越峰宣布,线月华为此次和银联联合创新,正式推出AI推理创新技术UCM(推理记忆数据管理其器)和管理系统的破解算法,这项突破性成果降低对HBM技术的赖A理黑依赖,提升国内AI大模型的科技开源推理能力。


该技术是线月一款以KV Cache为中心的推理加速套件,UCM集成了多类型缓存加速算法工具,正式实现推理过程中KV Cache记忆数据的破解分级管理,从而扩大推理上下文窗口,赖A理黑提升推理效率。科技开源“银联的线月实际案例和大量测试显示,UCM显著降低首Token的正式时延,最高降低90%,系统吞吐率最大提升22倍,上下文的推理窗口可以扩展10倍以上,这是对于AI推理系统一个巨大的进步。” 周越峰指出。

华为UCM技术已率先应用在中国银联“客户之声”、“营销策划”和“办公助手”三大业务场景,开展智慧金融AI推理加速应用试点,并且已经取得成果。华为表示,计划于2025年9月正式开源UCM,将在魔擎社区首发,并共享给业内所有Share Everything(共享架构)存储厂商和生态伙伴。

AI大模型推理给存储带来哪些挑战?UCM的创新之处如何解读?本文结合中国信通院人工智能研究平台与工程化部主任曹峰、华为数据存储产品线AI存储首席架构师李国杰的观点,进行详细分析。

AI大模型推理给存储带来三重挑战

“ChatGPT的访问量呈现线性增长,最新访问量达到4亿,受益于中国AI大模型DeepSeek爆发,日均调用量也在快速上升,2025年1月开始,中国AI推理的需求增长20倍,未来三年算力需求爆发。IDC表示,2024年算力需求60%是训练,40%是推理,到2027年中国用于推理的算力需求——工作负载将达到72.6%。” 中国信通院人工智能研究平台与工程化部主任曹峰分析说。

当下,AI大模型推理应用落地中,遇到推不动、推得慢和推得贵的三大挑战。首先,长文本越来越多,输入超过模型上下文窗口的内容,推理窗口小就推不动;其次,由于中美在AI基础设施的差距,中国互联网大模型首Token时延普遍慢于美国头部厂商的首Token时延,时延长度为后者的两倍;推得贵,美国大模型的推理吞吐率为中国大模型推理吞吐率的10倍。

华为公司副总裁、数据存储产品线总裁周越峰指出,AI时代,模型训练、推理效率与体验的量纲都以Token数为表征,Token经济已经到来。

在AI基础设施投资,中国和美国有差距,为了保障流畅的推理体验,企业要加大算力投入,但是如何改善AI推理的效率和体验,在推理效率与成本之间找到最佳平衡点?华为推出UCM,以KV Cache和记忆管理为中心提供全场景化系列化推理加速能力。

UCM两大关键能力和创新算法,破解HBM受困难题

HBM是解决"数据搬运"的关键技术。当HBM不足时,用户使用AI推理的体验会明显下降,导致出现任务卡顿、响应慢等问题。华为此次技术突破有望缓解这一瓶颈。

华为重磅推出UCM推理记忆数据管理器,包括对接不同引擎与算力的推理引擎插件(Connector)、支持多级KV Cache管理及加速算法的功能库(Accelerator)、高性能KV Cache存取适配器(Adapter)三大组件,通过推理框架、算力、存储三层协同,实现AI推理“更优体验、更低成本”。

UCM的创新之处,在于可以根据记忆热度在HBM、DRAM、SSD等存储介质中实现按需流动,同时融合多种稀疏注意力算法实现存算深度协同,使长序列场景下TPS(每秒处理token数)提升2至22倍,从而降低每个Token的推理成本。

“实时数据放在HBM当中,短期记忆数据放在DRAM中,其他数据就放在共享存储SSD中,极大提高系统的效率和AI推理能力。针对AI推理平衡成本和效能的挑战,华为推出UCM统一的记忆数据管理器,在两个层面以系统化的方案来解决问题。” 华为数据存储产品线AI存储首席架构师李国杰表示。

一、在底层的框架和机制上提供了多级缓存空间,构建智能管理以及智能流动的基础框架能力。在此基础之上,华为构筑了一系列创新的推理的加速算法和加速特性,包括自适应的全局Prefix Cache,降低首Token时延与单位Token成本。

二、采用动态的Training稀疏加速算法,倍数级提升长序列吞吐和体验。还有后缀检索、预测加速算法、PD检索加速和Agent原生记忆加速。

UCM将超长序列Cache分层卸载至外置专业存储,通过算法创新突破模型和资源限制,实现推理上下文窗口的10倍级扩展,满足长文本处理需求。

中国银联执行副总裁涂晓军分享说,华为与中国银联的联合创新技术试点中,在中国银联的“客户之声”业务场景下,借助UCM技术及工程化手段,大模型推理速度提升125倍,仅需10秒就可以精准识别客户高频问题,促进服务质量提升。

众所周知,目前,AI大模型训练对内存带宽需求呈指数级增长,传统DDR内存已无法满足需求。HBM(高带宽内存)是一种专用内存技术,用于 AI 处理器GPU和 HPC 系统,这些系统中带宽和能效比原始容量更为重要。HBM3 每堆栈可提供高达 819 GB/s 的传输速度,对于支持大型语言模型 (LLM)、神经网络训练和推理工作负载至关重要。

但是去年12月以来美国将HBM2E列入对中国的禁售清单,国产厂商HBM的突破还在推进中,华为推出UCM的重大意义,在于加速推进国产AI推理生态,其核心价值是推进更快的推理响应和更长的推理序列,以及更优化的成本。

中国信通院人工智能研究平台与工程化部主任曹峰认为,国产化AI推理生态建设应该加速,KV Cache已经成为架构优化的焦点,以KV Cache为核心的推理方案迭出,背后依赖的高性能存储、先进调度策略的重要性愈发显现。

李国杰还强调指出,AI是一个快速发展的行业,每6个月就会迎来新一轮的技术革新,UCM不仅定位于当下,解决AI推理问题,未来发展UCM将从KV Cache分层管理走向Agentic AI原生记忆管理和应用加速。

本文由电子发烧友原创,转载请注明以上来源。微信号zy1052625525。需入群交流,请添加微信elecfans999,投稿爆料采访需求,请发邮箱zhangying@huaqiu.com。

相关阅读

王云:大业美家一定会成为行业优质,华理骄傲

2025-08-27
全力以赴,不负韶华!不忘初心,砥砺前行!——大业美家集团总裁王云先生9月18日上午,华东理工大学党委书记、党委副书记、党办主任及对外联络处等校领导,以及原核工业部企业管理局领导等华东理工大学在京部分校

微博热搜文娱榜:杨幂新经纪人好漂亮

2025-08-27
近日,有不少网友就发现杨幂身边出现了一位新的面孔,疑似是新经纪人,而且这位全新的经纪人,不管是身材气质还是美貌都十分出众,站在大美女杨幂身边,也丝毫不落下风,因此也是成功美出圈,引来了一波热度。综合自

如何用市场营销让客户觉得占到便宜

2025-08-27
阿里云优惠券 先领券再下单“我是一家实体店主,开了一家培训机构,好不容易吸引来一些人,还都是贪便宜进来的,从来不买正价的东西,一直在等着打折搞活动,这让我非常头疼,如何办才好?&rdquo

如何用市场营销让客户觉得占到便宜

2025-08-27
阿里云优惠券 先领券再下单“我是一家实体店主,开了一家培训机构,好不容易吸引来一些人,还都是贪便宜进来的,从来不买正价的东西,一直在等着打折搞活动,这让我非常头疼,如何办才好?&rdquo

王云:大业美家一定会成为行业优质,华理骄傲

2025-08-27
全力以赴,不负韶华!不忘初心,砥砺前行!——大业美家集团总裁王云先生9月18日上午,华东理工大学党委书记、党委副书记、党办主任及对外联络处等校领导,以及原核工业部企业管理局领导等华东理工大学在京部分校

李季伦:微观世界书宏愿—新闻—科学网

2025-08-27
作者:王一鸣 来源: 中国科学报 发布时间:2025/3/19 7:56:11

三巨头外卖“冲单日”交锋背后:即时零售战白热化

2025-08-27
2025年6月5日,辽宁省沈阳市,京东、美团、饿了么的外卖配送员在街头相遇进行外卖竞速。视觉中国/图近日,阿里与美团先后发布即时零售战报,订单数据均创历史新高。2025年7月7日,淘宝闪购与饿了么联合

618转眼之间就要结束了你如愿了吗?

2025-08-27
618转眼之间就要结束了你如愿了吗?618!618!618!这一年的618马上结束了,你的实木家具如愿得到了吗?每个家庭对于客厅的家具选择都会非常的讲究,尤其是客厅里的沙发,无形中也能给客厅带来不一样

精心保养实木家具必须了解的详细内容!

2025-08-27
精心保养实木家具必须了解的详细内容!优质的实木家具通过有效的保养,能够让实木家具久用常新,有很多朋友的实木家具已经用了10多年,看上去比新的还要好看,这就离不开日常打理的功劳了,经常用软布顺着木的纹理

高温难过天天过 一起看看那些降温奇招

2025-08-27
一年中最热的三伏天来了,连续的高温令人连连叫苦。有网民忍不住大呼:“就到此为止吧,再热就不礼貌了。”对抗高温,你有奇招吗?高温天“厨娘”罢工 每天发愁点

微博热搜文娱榜:杨幂新经纪人好漂亮

2025-08-27
近日,有不少网友就发现杨幂身边出现了一位新的面孔,疑似是新经纪人,而且这位全新的经纪人,不管是身材气质还是美貌都十分出众,站在大美女杨幂身边,也丝毫不落下风,因此也是成功美出圈,引来了一波热度。综合自

華爾街巨頭、馬斯克挺身反關稅!他們如何施壓川普?|天下雜誌

2025-08-27
摩根大通、高盛、美國銀行執行長、馬斯克、諾貝爾經濟學大佬⋯⋯,愈來愈多專家察覺川普關稅新政的弊端。您的閱讀篇數已達上限立刻訂閱全閱讀,即可享全站不限篇數閱讀

初次设置switch2主机时别犯这个错误

2025-08-27
昨天,任天堂switch 2主机全球发售了,对于刚拿到主机的小伙伴一定要注意不要下面的错误,尤其是有swtich 1主机并且想数据迁移的小伙伴。在初次设置switch 2主机时,系统会让你选择是否进行

財經一週:川普關稅髮夾彎、債券避險失靈、台灣主動式ETF來了|天下雜誌

2025-08-27
川普對等關稅上路十幾個小時就政策髮夾彎,暫緩90天,但是從公佈、上路、豁免,全球股市已演出暴力式漲跌的紀錄。而在股市崩盤下,傳統上被視為避險資產的美國公債為何遭到恐慌拋售?投資市場另一個大事,台灣首檔

Nigel Sylvester x Air Jordan 4 RM 联名鞋款延期发布

2025-08-27
备受期待的联名鞋款Nigel Sylvester x Air Jordan 4 RM将于7月20日正式登场,较原定的7月3日发布日期有所推迟。这一消息已经得到了Nigel Sylvester本人的亲自

超吉椰椰子水,干净配料表,清爽原生态!

2025-08-27
发布者:娜娜 浏览量:3723发布时间:2024/7/25 16:35:19 近两年,跟“椰子”相关的产品,都能爆火!无论是火了几十年的椰树椰汁;还是瑞幸的生椰咖啡,亦或者品

泉州不动产权登记发证时间仅半天 全省最快

2025-08-27
今年以来市资源规划局深入开展不动产登记优化行动,充分发挥互联网高效便捷的优势,推行“一窗受理、并行办理”、“外网申请、内网审核”、不动产抵押登记&ldq

斯洛文尼亚启动氢能行动计划招标,剑指2030年脱碳目标

2025-08-27
近日,斯洛文尼亚环境、气候和能源部发布公开招标,正式启动国家能源和气候计划NECP)中氢能目标的行动计划草案拟定工作。这份意义重大的文件不仅将为斯洛文尼亚 2030 年前的氢能技术发展指明方向,还将对

贝塔斯全屋定制:以轻奢臻品,筑就理想家

2025-08-27
贝塔斯全屋定制:以轻奢臻品,筑就理想家责编:小玉 时间:2025-06-05 热度:28450

速看!电子证书全面上线,4招教您免费下载!

2025-08-27
即日起,为方便广大用户,伟业计量新发出的产品不再提供纸质版标物证书有其他疑问请联系客服咨询)。伟业标物电子证书下载提供了电脑端、手机端、微信公众号、扫描瓶身二维码四种下载方式,大家在阅览和使用标物证书
小编推荐
猜你喜欢
如果觉得快捷不错,还请把快捷分享到你的微信好友、朋友圈、微博等,万分叩谢
「**」百身何赎网为你提供,,,,等 http://m.dspuspeech.xyz/
点我复制链接

俺也是有底线滴

© 2023 百身何赎网 版权所有
为你提供,,,,等 http://m.dspuspeech.xyz/