博易网,更全更新的互联网资讯分享!

华为正式开源UCM技术:最大提升22倍 AI推理性能跃升

时间:2025-11-06 00:02人气:编辑:思思来源:

11月5日消息,近日,华为宣布针对AI推理加速的关键技术——UCM(Unified Cache Manager)推理记忆数据管理正式开源。

UCM以KV Cache多级缓存和推理记忆管理为中心,通过推理框架、算力、存储的三层协同,破解长序列推理效率低、成本高的难题,为企业提供更优的AI推理体验。

华为正式开源UCM技术:最大提升22倍 AI推理性能跃升(图1)

据介绍,UCM融合了多类型缓存加速算法工具,可分级管理在推理过程中产生的KV Cache记忆数据。

UCM具备四大关键能力:稀疏注意力、前缀缓存、预填充卸载、异构PD解耦。

它实现首Token时延最高降低90%,系统吞吐最大提升22倍,并达到10倍级上下文窗口扩展,显著提升了AI推理性能。

目前,UCM已在ModelEngine社区开放基础框架与工具链,开发者可通过社区获取UCM源代码与技术文档。

华为正式开源UCM技术:最大提升22倍 AI推理性能跃升(图2)
UCM产品架构

本文转载于快科技,文中观点仅代表作者个人看法,本站只做信息存储

本文来自于网络或用户投稿,本站仅供信息存储,阅读前请先查看【免责声明】,若本文侵犯了原著者的合法权益,可联系我们进行处理。本文链接:https://trustany.com/post/14361.html

标签: [db:tags]  
相关资讯
热门频道

热门标签

官方微信官方微博百家号

博易网网站简介 | 意见反馈 | 联系我们 | 博易网免责声明 | 广告服务

Copyright © 2002-2024 博易网 版权所有 声明:本站文章和数据均来自互联网,本站为免费公益性网站,如侵犯了您的权益,请联系我们妥善处理。 备案号:沪ICP备2022023686号-12