华为将发布AI推理创新技术UCM 实现高吞吐、低时延体验

2025-09-02 10:39 41587

8月12日,在2025金融AI推理应用落地与发展论坛上,华为将发布AI推理创新技术UCM(推理记忆数据管理器)。作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大了推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Tokenr的推理成本。


据介绍,推理体验直接关系到用户与AI交互时的感受,包括回答问题的时延、答案的准确度以及复杂上下文的推理能力等方面。当前,随着AI产业已从“追求模型能力的极限”转向“追求推理体验的最优化”,推理体验直接关联用户满意度、商业可行性等,成为衡量模型价值的黄金标尺。(第一财经)


2
标签: 华为 吞吐 推理 
发表评论
同步到贸金圈表情
最新评论

线上课程推荐

火热 45节精品课,全景解读供应链金融科技风控与数据风控的深度剖析

  • 精品
  • 上架时间:2020.08.29 17:33
  • 共 45 课时

火热 融资租赁42节精品课,获客、风控、资金从入门到精通

  • 精品
  • 上架时间:2020.10.11 10:35
  • 共 42 课时
7日热点新闻
热点栏目
贸金说图
专家投稿
贸金招聘
贸金微博
贸金书店

福费廷二级市场

贸金投融 (投融资信息平台)

活动

研习社

消息

我的

贸金书城

贸金公众号

贸金APP