日本正加速构建面向次世代AI的高密度算力基础设施,IIJ、PFN(公益财团法人理化学研究所计算科学研究机构)与JAIST(石川工业技术大学)三方联合开展了一项关键实证实证。该项目核心在于开发名为AImod的国产水冷数据中心模块,通过独特的密闭循环冷却技术,彻底解决了传统水冷系统水资源消耗巨大的痛点,将水使用效率(WUE)的设计值提升至近乎零的水平。
在冷却系统架构上,该实证实证采用了严格的密闭循环(Closed Loop)设计。服务器排出的二次冷却水经管道回流至中央分配单元(CDU),将热量传递给一次冷却水后,一次水被送往室外冷却塔进行降温,随后再次循环使用。系统中注入的防腐蚀剂确保了水质稳定,只要管道无破损,原则上无需补充新水,设计使用寿命可达10至15年。此外,系统内置泵具备智能混水功能,能将回水与冷水按需混合,精确控制供给服务器的水温。4月启动的实证实证期间,一次冷却水将在5℃至35℃的宽温域范围内进行测试。
针对高算力带来的散热挑战,项目部署了3台处理能力各为200kW的冷却塔,总设计负载达400kW,足以支撑10个IT机柜的满负荷运行。尽管2台冷却塔即可满足理论需求,但为确保系统的高可用性冗余,特意配置了3台。同时,为应对设备运行噪音,冷却塔周围专门设置了隔音墙。这种设计不仅解决了散热问题,还兼顾了环保与社区友好性。
水资源消耗一直是全球数据中心面临的严峻环境议题。IIJ常务执行董事山井美和指出,美国等地广泛采用的冷却塔蒸发冷却方式会导致大量水资源流失,已成为环境焦点。而本次日本实证实证采用的密闭循环技术,通过不蒸发水的方式实现冷却,是预防同类水资源危机的先行举措。在能效方面,该系统设计目标远超日本节能法基准,预计自由冷却模式下部分PUE(电力使用效率)可达1.1,全年平均PUE预计为1.2,显著优于行业通用的1.4目标值。
电力供应系统同样进行了革新,采用了三相四线400V供电方式。相比传统的三相三线制,该方式省去了变压器环节,不仅消除了变压过程中的电力损耗,还能更高效地提取所需电力,从而在降低成本和节省空间方面取得双重优势。硬件层面,PFN开发了搭载其自研芯片MN-Core 2的高密度水冷服务器,该芯片由最初的风冷版本重新设计为水冷版本,服务器采用6机柜架构,每机柜容纳6个节点,CDU位于底部以优化流体路径。
展望未来,PFN预计其第三代芯片单芯片功耗将突破1kW,整机功耗超过10kW,热密度将大幅提升,这使得水冷环境成为不可或缺的条件。三方计划将AImod作为模块化设施解决方案推广,支持从中型设施到受电容量50MW级超大规模数据中心的灵活扩展。同时,项目还将致力于验证不同厂商设备混用时的互操作性,通过统一冷却水温度、压力等运行参数,确立大规模AI计算基盘的实用标准。
日本在资源匮乏背景下对绿色算力基础设施的极致探索,展示了通过技术创新突破物理限制的可能性。对于中国而言,随着AI算力需求的爆发式增长,数据中心能耗与水资源压力日益凸显,这种密闭循环、零水耗的架构设计提供了极具参考价值的技术路径,特别是在高寒或缺水地区,此类高效能、低环境负荷的解决方案有望成为未来超大规模智算中心建设的重要方向。
