群联电子(Phison Electronics)近日在GTC展会上展示了其最新技术突破,重点介绍了如何通过多级内存架构支持更大规模的AI模型及长上下文推理。当前,随着AI平台需求激增,行业正面临日益严峻的内存限制挑战。特别是在对私有数据进行微调(fine-tuning)和推理时,需要消耗巨大的计算与内存资源,这给企业带来了沉重的投资压力。高昂的解决方案成本及工作流中的瓶颈,正在延缓具有商业价值的创新成果落地。
为应对这一挑战,群联推出了专为本地及边缘AI应用场景设计的aiDAPTIV技术。该技术创新性地利用Pascari系列SSD作为新的AI内存层级,智能地在GPU显存、系统内存与闪存之间扩展和管理AI工作内存。这种多级内存架构不仅适配了本地AI系统,还顺应了NVIDIA基础设施在数据中心环境中不断提升GPU内存容量以支持推理负载的趋势。
aiDAPTIV基于专为持续分页和上下文保持而优化的高耐久性闪存,能够在硬件配置固定的情况下,有效支撑高内存消耗的推理与微调任务。通过引入基于闪存的内存层级,企业不仅能在本地系统中应对不断演变的负载需求,还能在保障数据隐私的同时,提升长期基础设施的运营效率。
在NVIDIA GTC 2026展会上,群联展示了基于NVIDIA GB10 Grace Blackwell处理器、GeForce RTX 50系列GPU以及RTX PRO 6000 Blackwell Max-Q工作站版驱动的笔记本电脑、工作站及合作伙伴系统。演示重点突出了长上下文推理、利用KV缓存重用的AI智能体工作流,以及针对大规模模型的密集型微调,充分证明了aiDAPTIV如何通过整合GPU、系统内存与闪存,突破系统原有容量限制,支撑更复杂的AI负载。
对于中国AI硬件厂商而言,群联的aiDAPTIV方案提供了一个重要启示:在算力硬件趋同的背景下,通过存储架构的智能化创新来突破内存墙,将是提升边缘AI设备性能与性价比的关键路径,值得国内产业链在存储与AI协同设计上重点关注。
