中国 vs 美国:2026 AI 算力中心与液冷新格局
发布时间:2026-05-25 浏览次数:0

2026 年3月,加州圣何塞的 GTC 大会上,NVIDIA 明确表示,新一代 Vera Rubin 等旗舰 AI 平台将全面采用液冷,配套 Manifold(歧管)、UQD/MQD(快拆接头)、Cold Plate(冷板)等模块化方案,给全行业传递出一个信号:液冷已经从“可选优化”,变成 AI 工厂时代的必选底座。


图片


在这股浪潮之下,美国在建的是少数超大“AI 算力工厂”中国则在全国铺开“智算中心网络”。围绕算力中心与液冷方案,中美路线正在拉开清晰的结构性差异。



一、算力投资:美国押“大厂”,中国铺“网络”

美国:云巨头主导的超级 AI 工厂

这轮 AI 基建,核心玩家集中在美国几大云巨头。过去两三年,它们不断上调数据中心与 AI 相关资本开支,用百亿美元为单位砸钱。

  • 多家研究机构预计, 2026 年,全球与 AI 相关的资本开支将达到数千亿美元量级,其中美国云厂商贡献最高。
  • 微软亚马逊谷歌MetaOracle 等围绕 AI 数据中心、电力与网络基础设施形成一轮超级 Capex 周期,年度投入持续抬升。

美国的典型特点是:钱高度集中在少数几家公司手里,集中建设极少数超大体量的算力工厂。


图片


中国:国家工程 + 多主体共建算力底座

中国走的是另一条路。

  • 东数西算等国家工程带动下,多个国家级算力枢纽相继落地,形成覆盖全国的算力基础设施布局。
  • 三大运营商阿里腾讯百度字节等互联网企业,每年持续在智算中心上投入巨额资金,各地纷纷上马万卡级”“十万卡级项目。

整体来看,中国更像是在全国铺一张算力高速网:单个园区规模不一定最大,但项目数量多、分布广,适配的是千行百业用 AI”的应用逻辑。



二、园区规模与功率密度:1GW 工厂 vs 100MW 枢纽

美国:接近电厂级别的 AI 园区

美国新一代 AI 数据中心的容量,已经接近传统大型电厂。

  • 新建园区常见规划在数百兆瓦,有的目标指向 500MW–1GW,预留未来进一步扩容空间。
  • 为满足用电需求,不少项目同时规划可再生能源电站和储能设施,构建算力+绿电的一体化园区。
  • 单机柜功率密度不断提升:面向 AI 训练的机柜,主流已经进入 120–150kW 档位,搭配新一代 GPU 整柜,很容易继续往上推。

在这种规模下,数据中心更像一座“AI 发电厂,只是输出的是算力而不是电力。


国:50–150MW 级区域智算中心

中国的做法以区域智算中心为主:

  • 公开信息显示,很多新建智算中心的设计容量集中在 50–150MW 区间,个别重点项目略高于此,但整体仍明显低于美国超大园区。
  • 在西部算力枢纽,通常是多个 50–100MW 级园区叠加,再通过高速骨干网络为东部城市提供算力服务。
  • 机柜功率主流在 60–120kW,高端训练集群已经开始推向更高功率密度,只是当前在整体存量中的比例仍在快速上升阶段。


可以简化理解为:

  • 美国:少数 500MW–1GW 级超级园区
  • 中国:许多 50–150MW 级区域中心,通过网络编织成全国算力网
图片


三、芯片与整柜方案:NVIDIA 标配 vs 国产多路线

算力中心的核心仍是芯片整柜平台


美国:围绕 NVIDIA 的统一生态

在美国,大多数高端训练集群仍围绕 NVIDIA 平台构建:

  • H100/H200 之后,GB200B200 等新一代 GPU 加上 NVL72 等整柜方案,成为构建旗舰训练集群的标配组合

  • 谷歌 TPU亚马逊 Trainium 自研芯片主要承担部分云服务和推理场景训练侧的顶级集群依然高度依赖 NVIDIA

这意味着,上游在散热、供电、互联等配套方案上,会以 NVIDIA 的整机柜平台为中心推进标准化。液冷自然也紧跟其后。


中国:国产 GPU 快速爬坡 + 合规使用国际方案

中国则更强调芯片路线的多元化

  • 华为昇腾、以及海光壁仞昆仑芯天数智芯等国产 GPU/加速芯片快速迭代,逐步以整机柜、整中心方案形态进入运营商和行业客户项目。
  • 在合规框架下,国际主流芯片仍在部分场景中使用,但整体方向是提升国产比例,形成更自主的算力基础设施。

这一差异会直接反映到液冷方案、接口标准与整机柜结构上:美国更统一中国更百花齐放



四、液冷:NVIDIA 底线抬起来了

液冷是这次 GTC 的绝对主角之一。


1. GTC 2026:旗舰平台只做液冷

NVIDIA GTC 2026 上对新一代平台的定位非常直接:

  • Vera RubinNVL72 这一代旗舰 AI 系统被明确标记为全液冷方案,不再提供等价的高功率风冷版本。
  • 对数据中心而言,这几乎等于公告:未来想上最高端的 NVIDIA 平台,液冷必须是基础条件
  • 对应的单机柜功率指标,被业界普遍解读为将冲向 200kW 甚至更高,不再给风冷方案留出太多空间。

这一步,实际上把整个产业对散热方案的底线向前推进了一大截。


2. 模块拆分:Manifold、快拆接头、冷板

与以往只喊支持液冷不同,这次 NVIDIA 把液冷拆成几个关键模块:

  • Manifold(歧管):负责一柜之内冷却液的分配和回收,是整套系统的中枢。

  • UQD/MQD(快拆连接器):类似“液冷 USB 口”,影响安装维护效率、生态兼容性及漏液风险。

  • Cold Plate(冷板):直接贴合 GPU/CPU,决定着单芯片热阻和能效上限。


这套拆分方式本质上是在帮产业链划重点

  • 哪些部件是标准化的接口;
  • 哪些位置可能沉淀最多的附加价值。


对于中国和美国的液冷供应链来说,这都是非常直接的机会指引。


3. 技术路线:冷板为主,两相/浸没为前沿试验场

GTC 相关解读和产业链反馈看:

  • 冷板液冷在未来几年仍是主流路线,兼顾成熟度成本工程可实施性
  • 两相液冷、浸没式液冷更多用于少量极高热流密度或特殊场景,是前沿试验场
  • 微通道冷板、液态金属、金刚石散热等则作为在冷板框架内继续挖潜的进阶技术。

这套判断,对国内做液冷、材料、结构件的企业都有直接参照意义。


五、中美液冷落地节奏:谁更激进

美国:新建高密度集群几乎天然液冷

在美国,高密度 AI 集群的新建项目基本默认以液冷起步:

  • 设计阶段就将冷板液冷纳入整体方案,配合高功率整柜和高压供电系统。
  • 部分项目针对极限功率密度尝试两相或浸没式液冷,探索下一代形态。
  • 为降低 PUE 和用水量,不少园区还配套闭式循环系统、干冷器以及余热回收,形成更完整的绿色解决方案。

总体看,美国在新建高端项目上的液冷采用节奏,明显快于其他地区。


中国:存量风冷 + 新建液冷的加速切换

中国这边则是一个切换期

  • 存量数据中心以风冷为主,通过局部改造承载部分 AI 业务,但在极高功率密度场景会受到限制。
  • 新建智算中心,高密度区域普遍选用冷板液冷部分项目引入浸没式液冷以承载万卡级训练集群。
  • PUE、碳排放等政策约束下,液冷不仅提升能效,还是达标的关键手段,本土液冷厂商在整机柜、一体化模块等方面快速成熟。


随着 NVIDIA 等上游平台全面转向液冷,中国新一轮智算中心的默认形态,正在从风冷为主加速往液冷优先演进。



六、小结:AI 工厂时代,拼的不止是卡,更是液冷

站在 2026 年这个时间点回头看,中美 AI 算力中心与液冷路线的大致图景已经比较清晰:

  • 美国:少数云巨头集中砸钱,建设 500MW–1GW 级的超级算力工厂,以 NVIDIA 整柜生态为核心,率先把液冷做成旗舰平台标配
  • 中国:在国家工程引导下构建全国智算网络,依托多家国产 GPU 液冷厂商,走一条多点布局、生态多元的路线。

未来几年,谁能在液冷整机柜方案算力网络调度绿色能源上形成更强的综合能力,谁就更有资格在“AI 工厂时代拿到更多筹码。


-END-

源:半导体前沿