英伟达GTC发布新架构强化AI推理与存储


	英伟达GTC发布新架构强化AI推理与存储

在刚刚落幕的GTC 2026大会上,英伟达再次将人工智能确立为核心战略,并密集发布了一系列旨在解决多智能体系统(Multi-Agent Systems)挑战的硬件产品。面对需要处理海量Token且要求极速响应的应用场景,这家位于美国硅谷的巨头提出了创新方案:将Groq的LPU(语言处理单元)加速器与自家的Vera/CPU及Rubin/GPU芯片进行深度耦合。

英伟达发言人表示,通过结合Groq LPU的高带宽SRAM与GPU的大容量HBM,新架构实现了从预填充到解码的全流程优化,Token吞吐量最高可达传统方案的35倍,同时大幅增强了AI处理能力。这种组合不仅适用于小型模型,更能支撑参数量达万亿级、上下文窗口高达百万Token的超大规模模型推理。

在具体硬件部署上,英伟达展示了将DGX Vera Rubin NVL72服务器与Groq3 LPX机架集成的解决方案。该机架包含32个板卡,每板搭载8个LPU加速器。这种架构通过低延迟和高吞吐特性,有效解决了长上下文处理中的瓶颈。英伟达强调,GPU与LPU的比例可根据具体工作流灵活调整,旨在平衡高吞吐量与高智能交互的需求。

针对AI存储痛点,英伟达推出了基于BlueField-4处理器的BlueField-4 STX架构。该方案整合了Vera CPU与ConnectX-9 SuperNIC,并通过Spectrum-X以太网互联。其核心创新在于CMX(Content Memory Storage)内容存储技术,它将Key-Value Cache(键值缓存)从GPU内存卸载至专用的高带宽存储层。据英伟达数据,这一设计可使每秒处理的Token数提升5倍,能效比传统存储系统提高5倍

CMX架构被设计为一种可参考的存储层级方案,涵盖从GPU HBM(G1)到持久化对象存储(G4)的完整数据流。目前,SuperMicro、Quanta等服务器厂商已率先推出基于此设计的参考产品,CoreWeave和Oracle Cloud等云服务商也表现出浓厚兴趣,尽管AWS、Google和Azure尚未公开跟进。英伟达副总裁Yaël Chennar指出,随着上下文数据量的激增,将缓存数据移至专用存储层已成为提升能效的关键。

网络层面,英伟达正式商用Spectrum-6 SPX交换机,专为加速AI工厂内部流量设计。该交换机支持高达102.4 Tb/s的吞吐量,采用CPO(共封装光学)技术,提供低延迟、高带宽的机架间连接。配合Spectrum-X以太网或Quantum-X800 InfiniBand网络,该方案为大规模AI训练与推理提供了坚实的底层网络支撑。

对于中国AI行业从业者而言,英伟达此次将计算、存储与网络深度解耦并重新集成的策略,预示着未来AI基础设施将向“存算网一体化”演进,国内厂商在构建大模型集群时,需重点关注长上下文场景下的缓存优化与能效管理,以应对日益复杂的推理需求。

供应商:
河南红升智能仓储装备有限公司
企业认证
所在地
登封市产业集聚区少林大道与禹都大街交叉口东北角001号
联系电话
0371-60168780
业务经理
宋女士
手机号
15038030588
让卖家联系我
15038030588
公司资料
主要经营:河南货架厂,郑州货架厂,河南货架,郑州货架,河南仓储货架厂,郑州仓储货架厂,仓储货架,重型货架,轻型货架,横梁式货架,冷库货架,悬臂式货架,阁楼式货架,钢结构平台,智能立体库,钢制托盘
河南红升智能仓储装备有限公司(红升货架厂)主营:仓储货架,冷库货架,定制货架,重型货架,层板货架,阁楼货架,钢平台,悬臂货架,横梁货架,流利式货架,贯通式货架,智能立体库,及钢托盘等仓储配套设施。红升货架是中原地区较早从事仓储货架行业的企业,是一家集研发、设计、制造、安装调试的货架企业,从售前客户咨询到设计,从生产制造到现场安装调试,每一个环节都从客户角度出发,以完善的设计和规划方案,过硬的货架品 ...
商铺首页 | 更多产品 | 黄页介绍
相关工控系统及装备新闻
顺企网 | 公司 | 黄页 | 产品 | 采购 | 资讯 | 免费注册 轻松建站
免责声明:本站信息由河南红升智能仓储装备有限公司自行发布,交易请核实资质,谨防诈骗,如有侵权请联系我们   法律声明  联系顺企网
© 11467.com 顺企网 版权所有
ICP备案: 粤B2-20160116 / 粤ICP备12079258号 / 粤公网安备 44030702000007号 / 互联网药品信息许可证:(粤)—经营性—2023—0112