AI 第二圈投资地图,GPU、电力、液冷、数据中心和定制芯片之间到底是什么关系?

2026-05-22

AI 第二圈投资地图,GPU、电力、液冷、数据中心和定制芯片之间到底是什么关系?
Ad Unit (9876543210)

AI 股票涨到一个阶段以后,市场自然会开始往外看。

第一圈大家都知道。

NVIDIA、Microsoft、OpenAI、Anthropic、Google、Meta、xAI、Amazon。

再往外一圈,问题就开始变得有意思了。GPU 要放进服务器,服务器要放进数据中心,数据中心要接上电,电力进来以后还要散热,还要变压器、UPS、液冷管路、交换机、HBM 内存、先进封装、工程承包和长期电力协议。

这时候你会发现,AI 不是一个股票故事。

它更像一张付款路径图。

真正值得研究的不是「谁是 AI 概念股」,而是钱从哪里来,经过谁,卡在哪里,最后谁真的把收入和利润确认到财报里。

这篇文章不做个股推荐,也不告诉你哪家公司可以买。它只做一件事,把 AI 第二圈的公司关系、合同关系和风险链条拆清楚。

SmartLiving Visual

AI 第二圈互动关系图

点击公司,看它处在资金流的哪一层、连接谁、真正要观察什么风险。

资金流向
模型 / 应用需求 -> 云和数据中心容量 -> GPU / ASIC -> HBM / 封装 / 服务器 -> 电力 / 液冷 / 工程

模型与应用需求

模型和应用公司决定要买多少算力。

6 家公司

云、GPU 云与自建集群

把模型需求变成可部署、可出租或自用的算力容量。

7 家公司

GPU、自研芯片与 ASIC

商用 GPU、云厂商自研芯片、定制 ASIC 和网络芯片共同决定算力成本。

8 家公司

内存、封装、服务器

HBM、CoWoS、整柜集成把芯片变成可部署系统。

4 家公司

电力、冷却、工程

没有并网、变压器、液冷和施工,GPU 只能躺在账单里。

5 家公司

先看大图,AI 第二圈不是外围,而是基础设施账单

AI 第二圈指的是不直接生产大模型、也不一定直接卖聊天机器人,但在 AI 基础设施建设中拿到订单、设备需求或长期服务需求的公司。

这条链大概可以拆成五层。

第一层是模型与应用需求源头。OpenAI / ChatGPT、Anthropic / Claude、Google DeepMind / Gemini、Meta AI / Llama、xAI / Grok、Microsoft Copilot 这类公司和产品,才是真正把训练、推理和企业 AI 应用需求推向基础设施的起点。

第二层是云、GPU 云与自建集群承接方。Microsoft Azure、AWS、Google Cloud、Oracle Cloud、CoreWeave,以及 Meta 和 xAI 这类自建集群方,要把需求变成可出租、可计费或内部自用的算力容量。

第三层是计算硬件。这里不能只写 NVIDIA、AMD、Broadcom 和 Marvell,还要单独列出 Google TPU、AWS Trainium / Inferentia、Microsoft Maia、Meta MTIA 这些云厂商和平台公司的自研芯片路线。

第四层是芯片上游和系统集成。TSMC 的先进制程和 CoWoS 封装、Micron 和 SK hynix 的 HBM、Supermicro 和 Dell 的服务器整柜集成,都在这里。

第五层是物理基础设施。Constellation、NextEra、Talen、GE Vernova、Vertiv、Schneider Electric、Eaton、Trane、Switch 这类公司,解决的是电力、冷却、并网、配电、工程和厂房问题。

这个顺序很重要。

因为 AI 的钱不是平均洒下去的。它先从少数大客户的资本开支预算出来,再通过合同、订单、长期电力协议、参考设计和设备采购,一层层传导。

你如果只看公司名字,很容易被市场故事带着走。

你如果看付款路径,至少能多问一句,这家公司到底是在订单前端,还是在交付后端?

先把第一层定义清楚:模型需求、应用需求和云入口

这一层不是新闻里的“热门公司名单”,而是 AI 需求如何进入基础设施账单的入口。

ChatGPT、Claude、Gemini、Llama、Grok、Copilot 这些名字大家都知道。真正需要写清楚的,不是“还有谁”,而是它们分别通过哪条基础设施路径花钱:有的走外部云,有的走自研 TPU / Trainium / Maia / MTIA,有的自己建集群,有的同时做模型、云和应用入口。

Anthropic 是最典型的例子。Anthropic 官方说,Amazon 的追加投资让 AWS 成为其主要云和训练伙伴,Anthropic 会与 AWS 的 Annapurna Labs 一起优化 Trainium 加速器,用来训练和部署更大的 Claude 模型。来源:Anthropic, Powering the next generation of AI development with AWS

Google 也不能只被放在「云」这一层。Google 官方介绍 Gemini 时明确说,Gemini 在 Google 自研 TPU v4 和 v5e 上大规模训练,Google Cloud 也把 TPU、AI Hypercomputer、Vertex AI 连接成一套训练和推理基础设施。来源:Google, Introducing GeminiGoogle Cloud, Introducing Cloud TPU v5p and AI Hypercomputer

xAI 也不是边缘案例。NVIDIA 披露,xAI 位于 Memphis 的 Colossus 超算集群由 100,000 颗 NVIDIA Hopper GPU 组成,用于训练 Grok 系列模型,并使用 NVIDIA Spectrum-X 以太网网络。来源:NVIDIA, xAI Colossus supercomputer

Microsoft 也不能只当 Azure 云厂商看。Copilot、GitHub Copilot、Office AI 和企业 AI 应用本身会制造推理需求,而 Azure 又把这些需求接回 NVIDIA、OpenAI 和数据中心容量。NVIDIA 和 Microsoft Azure 曾披露面向 OpenAI 工作负载的 GB300 NVL72 大规模集群。来源:Microsoft Azure, NVIDIA GB300 NVL72 for OpenAI workloads

所以这篇文章的关系图已经按这个逻辑重画:第一层是 ChatGPT、Claude、Gemini、Llama、Grok、Copilot 需求层;第二层是 Azure、AWS、Google Cloud、Oracle、CoreWeave、Meta 自建基础设施、xAI Colossus 这类容量承接方;第三层才是 NVIDIA、AMD、Google TPU、AWS Trainium、Microsoft Maia、Meta MTIA、Broadcom、Marvell 等芯片路线。

OpenAI 把 AI 资本开支变成了 GW 单位

AI 第二圈火起来,一个关键原因是 OpenAI 把算力需求讲成了 GW。

2025 年 7 月,OpenAI 宣布与 Oracle 合作开发 4.5GW 的额外 Stargate 数据中心容量。OpenAI 表示,加上 Abilene 的 Stargate I,这会让其正在开发的 Stargate AI 数据中心容量超过 5GW,并运行超过 200 万颗芯片。来源:OpenAI, Stargate advances with 4.5 GW partnership with Oracle

2025 年 9 月,OpenAI、Oracle 和 SoftBank 又宣布五个新的 Stargate 数据中心地点。OpenAI 称,这些新地点连同 Abilene 和 CoreWeave 项目,会让 Stargate 计划容量接近 7GW,未来三年投资超过 4000 亿美元。来源:OpenAI, Oracle, and SoftBank expand Stargate with five new AI data center sites

同月,OpenAI 和 NVIDIA 宣布一份意向书,计划部署至少 10GW 的 NVIDIA 系统,NVIDIA 表示会随着每个 GW 部署进度,逐步向 OpenAI 投资最多 1000 亿美元。来源:OpenAI and NVIDIA announce strategic partnership

这里要很冷静。

意向书不是已经完成的合同,GW 规划也不是已经通电的机房。它们代表的是建设方向、资本开支意愿和供应链需求,不等于今天已经确认的利润。

但它们有一个很强的信号意义。

AI 基础设施不再是「买几万张 GPU」这种说法,而是进入了电力、厂房、并网和工程尺度。钱开始从芯片订单,外溢到电力系统和工业基础设施。

这就是第二圈真正被市场盯上的原因。

芯片层要分三条线:商用 GPU、自研芯片、ASIC 与网络

NVIDIA 仍然是 AI 算力链条里最核心的公司。

它不只是卖 GPU。

从 Hopper 到 Blackwell,再到 2026 年公布的 Vera Rubin 平台,NVIDIA 已经把 GPU、CPU、NVLink、ConnectX、BlueField、Spectrum、整柜系统、网络和数据中心参考设计打包成 AI Factory 的概念。NVIDIA 在 2026 年 GTC 公布 Vera Rubin DSX AI Factory reference design,名单里包括 Eaton、Schneider Electric、Siemens、Switch、Trane Technologies、Vertiv 等工程、电气和冷却公司。来源:NVIDIA Vera Rubin DSX AI Factory reference design

这说明一件事。

NVIDIA 现在想卖的不只是芯片,而是整座 AI 工厂的标准答案。

但也正因为它太中心,第二圈不能只围着它看。

OpenAI 和 Broadcom 在 2025 年 10 月宣布合作,计划部署 10GW 由 OpenAI 设计的定制 AI 加速器和网络系统,目标从 2026 年下半年开始部署,至 2029 年底完成。来源:OpenAI and Broadcom announce strategic collaboration

Meta 也在 2026 年扩大了与 Broadcom 的 MTIA 定制芯片合作。Meta 说,它会与 Broadcom 共同开发多代 MTIA 芯片,用于支撑 Meta 各产品中的 AI 工作负载。来源:Meta partners with Broadcom to co-develop custom AI silicon

但如果芯片层只写 NVIDIA、AMD、Broadcom 和 Marvell,还是不完整。

AI 芯片层至少要分三条线:

第一条是商用 GPU / 加速器路线:NVIDIA GPU 仍然是主干,AMD Instinct 是重要替代路线。

第二条是云厂商和平台公司的自研芯片路线:Google TPU、AWS Trainium / Inferentia、Microsoft Maia、Meta MTIA。Google 官方资料显示 Gemini 使用 Google TPU 训练和服务;AWS 的 Trainium 与 Anthropic / Claude 深度绑定;Microsoft 官方博客介绍 Maia 200 时,明确把它放进 Azure、Microsoft Foundry、Microsoft 365 Copilot 和 OpenAI 相关工作负载里。来源:Microsoft, Maia 200AWS Trainium customers

第三条是定制 ASIC、网络和 I/O 路线:Broadcom、Marvell、NVIDIA Spectrum-X / InfiniBand、Arista 等公司和产品在这里。它们不一定直接替代 GPU,但会决定大集群的数据移动效率、推理成本和客户绑定。

这三条线要放在同一张图里看。

如果说 NVIDIA 是通用 AI 训练和高端推理的主干,那么 Google TPU、AWS Trainium、Microsoft Maia、Meta MTIA、Broadcom、Marvell、TSMC、HBM、网络交换芯片就是越来越重要的分支。它们不一定替代 NVIDIA,但会分流一部分需求,也会把 AI 钱流向不同公司。

普通投资者最容易犯的错,是把 AI 算力等同于 NVIDIA 一家公司。

现实更复杂。

HBM 和先进封装,是 GPU 背后的真瓶颈

GPU 看起来是主角,但高端 AI 芯片离不开 HBM。

HBM 是 High Bandwidth Memory,高带宽内存。大模型训练和推理需要持续搬运大量数据,内存带宽不足,GPU 再贵也会被卡住。

Micron 在 2026 年 3 月宣布,面向 NVIDIA Vera Rubin 的 HBM4 36GB 12H 已经在 2026 年第一季度开始量产出货。来源:Micron HBM4 for NVIDIA Vera Rubin

但 HBM 还不是终点。

GPU die 和 HBM die 要通过先进封装放到一起。TSMC 的 CoWoS 就是这里的关键环节。TSMC 2024 年年报提到,AI 相关需求强劲,并列出 CoWoS、InFO、TSMC-SoIC 等先进封装和 3D 堆叠技术。来源:TSMC 2024 Annual Report

这也是为什么很多时候你会看到一个很奇怪的现象,市场讨论的是 GPU 供不应求,但真正限制交付的可能是封装产能、HBM 供应、基板、整柜交付或液冷能力。

AI 第二圈的难点就在这里。

看似是一个主题,其实每一层的瓶颈都不一样。

数据中心不是房子,是带电的金融资产

很多人一听数据中心,就以为它像办公楼。

不太一样。

AI 数据中心更像一个带电的金融资产。它需要土地、建筑、变压器、并网容量、冷却系统、服务器机柜、长期客户合同和融资结构。哪一个环节慢,收入确认就慢。

Oracle 在 Stargate 里的角色,就是把 OpenAI 的模型需求和真实数据中心容量连接起来。CoreWeave 这类 GPU 云公司,则是把 NVIDIA 系统变成可租赁的云算力。

传统数据中心 REIT,比如 Equinix、Digital Realty,也会受益于容量需求,但它们的扩张不是只看钱够不够,还要看电力、许可、土地、客户合同和融资成本。

这里的一个关键判断是,数据中心公司不一定是轻资产科技公司。

它们很重。

重资产意味着折旧、债务、利率、租约期限和利用率都很关键。AI 需求再强,如果融资成本高、建设延迟、客户集中度过高,风险也会留在资产负债表里。

电力才是 AI 第二圈最硬的约束

IEA 在 2026 年的 Energy and AI 更新中说,全球数据中心用电量在 2025 年增长 17%,预计会从 2025 年的 485TWh 左右,到 2030 年接近翻倍至 950TWh,约占全球电力需求的 3%。来源:IEA, Key Questions on Energy and AI

这就是为什么市场突然开始看核电、天然气、电网、变压器和电力设备。

Microsoft 与 Constellation 签署了 20 年电力购买协议,推动 Pennsylvania 的 Crane Clean Energy Center,也就是原 Three Mile Island Unit 1 重启。Constellation 表示,该协议将支持核电站重启,并向 Microsoft 提供电力。来源:Constellation, Crane Clean Energy Center announcement

NextEra Energy 和 Google Cloud 在 2025 年 12 月宣布能源和技术合作,双方计划在美国多个地点扩展多个 GW 级数据中心容量和能源基础设施。来源:NextEra Energy and Google Cloud strategic partnership

NVIDIA 在 2026 年也和 Emerald AI 以及 AES、Constellation、Invenergy、NextEra Energy、Nscale Energy & Power、Vistra 等能源公司合作,探索能作为电网灵活资产运行的新一代 AI factories。来源:NVIDIA and Emerald AI join energy companies

这些新闻有一个共同点。

AI 已经不只是科技股问题,而是电力系统问题。

但这也意味着,第二圈里的电力公司不是马上就会「躺着收钱」。核电重启需要监管,电网接入需要审批,输电需要建设,地方社区可能反对,设备交付也可能排队。

电力是机会,也是时间风险。

液冷、电气和整柜系统,是最容易被普通人低估的一层

高密度 GPU 集群不是普通服务器。

功耗高,热密度高,机柜设计复杂。很多新一代 AI 服务器已经默认走液冷路线,传统空气冷却越来越吃力。

Vertiv 在 2026 年宣布参与 NVIDIA Vera Rubin DSX AI Factory reference design,提供电力和冷却相关的可仿真资产、接口和可重复基础设施模块。来源:Vertiv on NVIDIA Vera Rubin DSX AI factories

Eaton 在 2025 年公布用于 AI 数据中心的 800V DC 供电参考架构,并称其设计支持 NVIDIA 公布的 800V DC 架构。来源:Eaton 800 VDC architecture for AI factories

Supermicro 在 2026 年披露 Vera Rubin NVL72、HGX Rubin NVL8 和 Vera CPU 系统,并表示其 Vera Rubin NVL72 会使用新的 DCBBS 液冷组件,以支持机柜和集群级别的功耗与散热。来源:Supermicro Vera Rubin NVL72 and liquid cooling

这一层很适合 SmartLiving 的读者去理解。

因为它不是纯科技概念,也不是纯金融叙事。它是真实工程,真实设备,真实交付。

你可以把它看成 AI 工厂的水电装修。

没有这层,芯片再强也不能稳定运行。

Interactive Risk View

AI 第二圈动态风险雷达

点雷达点或下方风险项,查看为什么第二圈不是更安全,而是风险更分散。

AI第二圈

合同关系怎么读,不要把公告直接当利润

下面这张表,比公司名单更有用。

| 关系 | 类型 | 说明 | 需要小心的点 | | --- | --- | --- | --- | | OpenAI + Oracle | 数据中心容量协议 | 4.5GW 额外 Stargate 容量 | 容量开发不等于已经通电 | | OpenAI + NVIDIA | 意向书 / 战略合作 | 至少 10GW NVIDIA 系统,NVIDIA 拟最多投资 $100B | 意向书不是最终合同,部署分多年 | | OpenAI + Broadcom | 定制加速器合作 | 10GW OpenAI 设计的 AI 加速器和网络系统 | 2026 下半年开始部署,收入确认有时间差 | | Anthropic + Amazon / AWS | 云、投资与 Trainium 合作 | Claude 训练和部署需求进入 AWS、Trainium 和数据中心容量 | Trainium 性能、利用率和合约经济性要持续验证 | | Google / Gemini + TPU / Google Cloud | 自研 TPU 与云基础设施 | Gemini 需求连接 TPU、AI Hypercomputer、Vertex AI 和 Google Cloud | 一部分价值留在 Google 内部,不一定外溢给公开供应商 | | Microsoft + Maia / Azure | 自研推理加速器 | Maia 连接 Azure、Microsoft Foundry、Copilot 和 OpenAI 相关工作负载 | 需要看真实部署规模和每美元性能改善 | | xAI + NVIDIA | Colossus 超算集群 | 100,000 颗 Hopper GPU 和 Spectrum-X 网络用于 Grok 模型 | xAI 非上市公司,公开财务透明度有限 | | Microsoft Copilot + Azure / OpenAI / NVIDIA | 应用需求回流云基础设施 | Copilot 类应用制造推理需求,Azure 承接 OpenAI 工作负载和 GPU 集群 | 要看应用收入能否覆盖基础设施成本 | | Meta + Broadcom | 定制芯片合作 | 多代 MTIA 芯片合作 | 更偏推理,不代表训练 GPU 立刻被替代 | | Microsoft + Constellation | 20 年 PPA | 支持 Crane Clean Energy Center 重启 | 核电监管、重启成本、并网时间 | | Google Cloud + NextEra | 能源和数据中心基础设施合作 | 多个 GW 级地点 | 许可、输电、资本开支和区域监管 | | NVIDIA + Vertiv / Schneider / Eaton / Trane | AI Factory 参考设计生态 | 电力、冷却、工程模块进入 NVIDIA 体系 | 参考设计不等于每家公司都拿到同等订单 | | NVIDIA + Supermicro | 整柜服务器和液冷系统 | Vera Rubin NVL72、HGX Rubin NVL8、DCBBS 液冷组件 | 交付质量、毛利、库存和客户集中度 |

这张表背后的原则很简单。

公告不是收入。

收入不是利润。

利润不是自由现金流。

自由现金流也不等于合理估值。

市场最容易在第二圈犯的错,就是看到一个大合同标题,直接把未来几年利润一次性放进今天的股价里。

普通投资者应该用这五个问题过滤 AI 第二圈

如果你研究这类公司,我会建议先问五个问题。

这五个问题比问「是不是 AI 概念」更有用。

因为第二圈公司的风险经常不是需求不存在,而是需求兑现太慢,建设成本太高,估值跑得太快。

这篇文章和你已有的 AI 股票仓位有什么关系

如果你已经在 AI 股票上有盈利,要看的不只是产业链。

卖出时的交易规费、短期和长期资本利得、NIIT、纽约州和纽约市税,也会影响你最后留下多少钱。可以接着读这篇:AI 股大赚后的清算日,2026 交易规费、资本利得税和纽约税账怎么算?

如果你关心的是自己买硬件跑本地模型,而不是买相关公司股票,可以看这篇:2026 本地 AI 硬件成本核算,买 NVIDIA 显卡还是大内存 Mac?

最后的结论

AI 第二圈值得研究。

但它不是更安全的第一圈替代品。

它是一条更长、更重、更慢的资本传导链。

GPU 是最亮的地方,电力是最硬的地方,HBM 和封装是最容易卡住的地方,液冷和整柜系统是最容易被普通人低估的地方。

真正精明的看法不是「下一只 NVIDIA 是谁」。

而是先看懂一张图。

钱从哪里出来,经过哪几层,哪些公司只是出现在新闻里,哪些公司真的能把项目交付成收入和现金流。

看懂这张图,才有资格继续讨论估值。

资料来源

免责声明: 本文仅供教育和信息参考,不构成投资、税务、法律或个人财务建议。文中提到的公司、合同、合作关系和官方公告,只用于说明 AI 基础设施资本开支的传导路径,不代表对任何证券、基金、ETF 或行业主题的买卖建议。AI 基础设施涉及技术、供应链、监管、融资、估值和执行风险,做任何投资决定前,请结合自己的财务状况并咨询合格专业人士。

SmartLiving 实用工具

继续用免费工具把日常决定算清楚。

Ad Unit (1122334455)