AI 第二圈投资地图,GPU、电力、液冷、数据中心和定制芯片之间到底是什么关系?
2026-05-22

AI 股票涨到一个阶段以后,市场自然会开始往外看。
第一圈大家都知道。
NVIDIA、Microsoft、OpenAI、Anthropic、Google、Meta、xAI、Amazon。
再往外一圈,问题就开始变得有意思了。GPU 要放进服务器,服务器要放进数据中心,数据中心要接上电,电力进来以后还要散热,还要变压器、UPS、液冷管路、交换机、HBM 内存、先进封装、工程承包和长期电力协议。
这时候你会发现,AI 不是一个股票故事。
它更像一张付款路径图。
真正值得研究的不是「谁是 AI 概念股」,而是钱从哪里来,经过谁,卡在哪里,最后谁真的把收入和利润确认到财报里。
这篇文章不做个股推荐,也不告诉你哪家公司可以买。它只做一件事,把 AI 第二圈的公司关系、合同关系和风险链条拆清楚。
SmartLiving Visual
AI 第二圈互动关系图
点击公司,看它处在资金流的哪一层、连接谁、真正要观察什么风险。
模型与应用需求
模型和应用公司决定要买多少算力。
云、GPU 云与自建集群
把模型需求变成可部署、可出租或自用的算力容量。
GPU、自研芯片与 ASIC
商用 GPU、云厂商自研芯片、定制 ASIC 和网络芯片共同决定算力成本。
内存、封装、服务器
HBM、CoWoS、整柜集成把芯片变成可部署系统。
电力、冷却、工程
没有并网、变压器、液冷和施工,GPU 只能躺在账单里。
先看大图,AI 第二圈不是外围,而是基础设施账单
AI 第二圈指的是不直接生产大模型、也不一定直接卖聊天机器人,但在 AI 基础设施建设中拿到订单、设备需求或长期服务需求的公司。
这条链大概可以拆成五层。
第一层是模型与应用需求源头。OpenAI / ChatGPT、Anthropic / Claude、Google DeepMind / Gemini、Meta AI / Llama、xAI / Grok、Microsoft Copilot 这类公司和产品,才是真正把训练、推理和企业 AI 应用需求推向基础设施的起点。
第二层是云、GPU 云与自建集群承接方。Microsoft Azure、AWS、Google Cloud、Oracle Cloud、CoreWeave,以及 Meta 和 xAI 这类自建集群方,要把需求变成可出租、可计费或内部自用的算力容量。
第三层是计算硬件。这里不能只写 NVIDIA、AMD、Broadcom 和 Marvell,还要单独列出 Google TPU、AWS Trainium / Inferentia、Microsoft Maia、Meta MTIA 这些云厂商和平台公司的自研芯片路线。
第四层是芯片上游和系统集成。TSMC 的先进制程和 CoWoS 封装、Micron 和 SK hynix 的 HBM、Supermicro 和 Dell 的服务器整柜集成,都在这里。
第五层是物理基础设施。Constellation、NextEra、Talen、GE Vernova、Vertiv、Schneider Electric、Eaton、Trane、Switch 这类公司,解决的是电力、冷却、并网、配电、工程和厂房问题。
这个顺序很重要。
因为 AI 的钱不是平均洒下去的。它先从少数大客户的资本开支预算出来,再通过合同、订单、长期电力协议、参考设计和设备采购,一层层传导。
你如果只看公司名字,很容易被市场故事带着走。
你如果看付款路径,至少能多问一句,这家公司到底是在订单前端,还是在交付后端?
先把第一层定义清楚:模型需求、应用需求和云入口
这一层不是新闻里的“热门公司名单”,而是 AI 需求如何进入基础设施账单的入口。
ChatGPT、Claude、Gemini、Llama、Grok、Copilot 这些名字大家都知道。真正需要写清楚的,不是“还有谁”,而是它们分别通过哪条基础设施路径花钱:有的走外部云,有的走自研 TPU / Trainium / Maia / MTIA,有的自己建集群,有的同时做模型、云和应用入口。
Anthropic 是最典型的例子。Anthropic 官方说,Amazon 的追加投资让 AWS 成为其主要云和训练伙伴,Anthropic 会与 AWS 的 Annapurna Labs 一起优化 Trainium 加速器,用来训练和部署更大的 Claude 模型。来源:Anthropic, Powering the next generation of AI development with AWS
Google 也不能只被放在「云」这一层。Google 官方介绍 Gemini 时明确说,Gemini 在 Google 自研 TPU v4 和 v5e 上大规模训练,Google Cloud 也把 TPU、AI Hypercomputer、Vertex AI 连接成一套训练和推理基础设施。来源:Google, Introducing Gemini;Google Cloud, Introducing Cloud TPU v5p and AI Hypercomputer
xAI 也不是边缘案例。NVIDIA 披露,xAI 位于 Memphis 的 Colossus 超算集群由 100,000 颗 NVIDIA Hopper GPU 组成,用于训练 Grok 系列模型,并使用 NVIDIA Spectrum-X 以太网网络。来源:NVIDIA, xAI Colossus supercomputer
Microsoft 也不能只当 Azure 云厂商看。Copilot、GitHub Copilot、Office AI 和企业 AI 应用本身会制造推理需求,而 Azure 又把这些需求接回 NVIDIA、OpenAI 和数据中心容量。NVIDIA 和 Microsoft Azure 曾披露面向 OpenAI 工作负载的 GB300 NVL72 大规模集群。来源:Microsoft Azure, NVIDIA GB300 NVL72 for OpenAI workloads
所以这篇文章的关系图已经按这个逻辑重画:第一层是 ChatGPT、Claude、Gemini、Llama、Grok、Copilot 需求层;第二层是 Azure、AWS、Google Cloud、Oracle、CoreWeave、Meta 自建基础设施、xAI Colossus 这类容量承接方;第三层才是 NVIDIA、AMD、Google TPU、AWS Trainium、Microsoft Maia、Meta MTIA、Broadcom、Marvell 等芯片路线。
OpenAI 把 AI 资本开支变成了 GW 单位
AI 第二圈火起来,一个关键原因是 OpenAI 把算力需求讲成了 GW。
2025 年 7 月,OpenAI 宣布与 Oracle 合作开发 4.5GW 的额外 Stargate 数据中心容量。OpenAI 表示,加上 Abilene 的 Stargate I,这会让其正在开发的 Stargate AI 数据中心容量超过 5GW,并运行超过 200 万颗芯片。来源:OpenAI, Stargate advances with 4.5 GW partnership with Oracle
2025 年 9 月,OpenAI、Oracle 和 SoftBank 又宣布五个新的 Stargate 数据中心地点。OpenAI 称,这些新地点连同 Abilene 和 CoreWeave 项目,会让 Stargate 计划容量接近 7GW,未来三年投资超过 4000 亿美元。来源:OpenAI, Oracle, and SoftBank expand Stargate with five new AI data center sites
同月,OpenAI 和 NVIDIA 宣布一份意向书,计划部署至少 10GW 的 NVIDIA 系统,NVIDIA 表示会随着每个 GW 部署进度,逐步向 OpenAI 投资最多 1000 亿美元。来源:OpenAI and NVIDIA announce strategic partnership
这里要很冷静。
意向书不是已经完成的合同,GW 规划也不是已经通电的机房。它们代表的是建设方向、资本开支意愿和供应链需求,不等于今天已经确认的利润。
但它们有一个很强的信号意义。
AI 基础设施不再是「买几万张 GPU」这种说法,而是进入了电力、厂房、并网和工程尺度。钱开始从芯片订单,外溢到电力系统和工业基础设施。
这就是第二圈真正被市场盯上的原因。
芯片层要分三条线:商用 GPU、自研芯片、ASIC 与网络
NVIDIA 仍然是 AI 算力链条里最核心的公司。
它不只是卖 GPU。
从 Hopper 到 Blackwell,再到 2026 年公布的 Vera Rubin 平台,NVIDIA 已经把 GPU、CPU、NVLink、ConnectX、BlueField、Spectrum、整柜系统、网络和数据中心参考设计打包成 AI Factory 的概念。NVIDIA 在 2026 年 GTC 公布 Vera Rubin DSX AI Factory reference design,名单里包括 Eaton、Schneider Electric、Siemens、Switch、Trane Technologies、Vertiv 等工程、电气和冷却公司。来源:NVIDIA Vera Rubin DSX AI Factory reference design
这说明一件事。
NVIDIA 现在想卖的不只是芯片,而是整座 AI 工厂的标准答案。
但也正因为它太中心,第二圈不能只围着它看。
OpenAI 和 Broadcom 在 2025 年 10 月宣布合作,计划部署 10GW 由 OpenAI 设计的定制 AI 加速器和网络系统,目标从 2026 年下半年开始部署,至 2029 年底完成。来源:OpenAI and Broadcom announce strategic collaboration
Meta 也在 2026 年扩大了与 Broadcom 的 MTIA 定制芯片合作。Meta 说,它会与 Broadcom 共同开发多代 MTIA 芯片,用于支撑 Meta 各产品中的 AI 工作负载。来源:Meta partners with Broadcom to co-develop custom AI silicon
但如果芯片层只写 NVIDIA、AMD、Broadcom 和 Marvell,还是不完整。
AI 芯片层至少要分三条线:
第一条是商用 GPU / 加速器路线:NVIDIA GPU 仍然是主干,AMD Instinct 是重要替代路线。
第二条是云厂商和平台公司的自研芯片路线:Google TPU、AWS Trainium / Inferentia、Microsoft Maia、Meta MTIA。Google 官方资料显示 Gemini 使用 Google TPU 训练和服务;AWS 的 Trainium 与 Anthropic / Claude 深度绑定;Microsoft 官方博客介绍 Maia 200 时,明确把它放进 Azure、Microsoft Foundry、Microsoft 365 Copilot 和 OpenAI 相关工作负载里。来源:Microsoft, Maia 200;AWS Trainium customers
第三条是定制 ASIC、网络和 I/O 路线:Broadcom、Marvell、NVIDIA Spectrum-X / InfiniBand、Arista 等公司和产品在这里。它们不一定直接替代 GPU,但会决定大集群的数据移动效率、推理成本和客户绑定。
这三条线要放在同一张图里看。
如果说 NVIDIA 是通用 AI 训练和高端推理的主干,那么 Google TPU、AWS Trainium、Microsoft Maia、Meta MTIA、Broadcom、Marvell、TSMC、HBM、网络交换芯片就是越来越重要的分支。它们不一定替代 NVIDIA,但会分流一部分需求,也会把 AI 钱流向不同公司。
普通投资者最容易犯的错,是把 AI 算力等同于 NVIDIA 一家公司。
现实更复杂。
HBM 和先进封装,是 GPU 背后的真瓶颈
GPU 看起来是主角,但高端 AI 芯片离不开 HBM。
HBM 是 High Bandwidth Memory,高带宽内存。大模型训练和推理需要持续搬运大量数据,内存带宽不足,GPU 再贵也会被卡住。
Micron 在 2026 年 3 月宣布,面向 NVIDIA Vera Rubin 的 HBM4 36GB 12H 已经在 2026 年第一季度开始量产出货。来源:Micron HBM4 for NVIDIA Vera Rubin
但 HBM 还不是终点。
GPU die 和 HBM die 要通过先进封装放到一起。TSMC 的 CoWoS 就是这里的关键环节。TSMC 2024 年年报提到,AI 相关需求强劲,并列出 CoWoS、InFO、TSMC-SoIC 等先进封装和 3D 堆叠技术。来源:TSMC 2024 Annual Report
这也是为什么很多时候你会看到一个很奇怪的现象,市场讨论的是 GPU 供不应求,但真正限制交付的可能是封装产能、HBM 供应、基板、整柜交付或液冷能力。
AI 第二圈的难点就在这里。
看似是一个主题,其实每一层的瓶颈都不一样。
数据中心不是房子,是带电的金融资产
很多人一听数据中心,就以为它像办公楼。
不太一样。
AI 数据中心更像一个带电的金融资产。它需要土地、建筑、变压器、并网容量、冷却系统、服务器机柜、长期客户合同和融资结构。哪一个环节慢,收入确认就慢。
Oracle 在 Stargate 里的角色,就是把 OpenAI 的模型需求和真实数据中心容量连接起来。CoreWeave 这类 GPU 云公司,则是把 NVIDIA 系统变成可租赁的云算力。
传统数据中心 REIT,比如 Equinix、Digital Realty,也会受益于容量需求,但它们的扩张不是只看钱够不够,还要看电力、许可、土地、客户合同和融资成本。
这里的一个关键判断是,数据中心公司不一定是轻资产科技公司。
它们很重。
重资产意味着折旧、债务、利率、租约期限和利用率都很关键。AI 需求再强,如果融资成本高、建设延迟、客户集中度过高,风险也会留在资产负债表里。
电力才是 AI 第二圈最硬的约束
IEA 在 2026 年的 Energy and AI 更新中说,全球数据中心用电量在 2025 年增长 17%,预计会从 2025 年的 485TWh 左右,到 2030 年接近翻倍至 950TWh,约占全球电力需求的 3%。来源:IEA, Key Questions on Energy and AI
这就是为什么市场突然开始看核电、天然气、电网、变压器和电力设备。
Microsoft 与 Constellation 签署了 20 年电力购买协议,推动 Pennsylvania 的 Crane Clean Energy Center,也就是原 Three Mile Island Unit 1 重启。Constellation 表示,该协议将支持核电站重启,并向 Microsoft 提供电力。来源:Constellation, Crane Clean Energy Center announcement
NextEra Energy 和 Google Cloud 在 2025 年 12 月宣布能源和技术合作,双方计划在美国多个地点扩展多个 GW 级数据中心容量和能源基础设施。来源:NextEra Energy and Google Cloud strategic partnership
NVIDIA 在 2026 年也和 Emerald AI 以及 AES、Constellation、Invenergy、NextEra Energy、Nscale Energy & Power、Vistra 等能源公司合作,探索能作为电网灵活资产运行的新一代 AI factories。来源:NVIDIA and Emerald AI join energy companies
这些新闻有一个共同点。
AI 已经不只是科技股问题,而是电力系统问题。
但这也意味着,第二圈里的电力公司不是马上就会「躺着收钱」。核电重启需要监管,电网接入需要审批,输电需要建设,地方社区可能反对,设备交付也可能排队。
电力是机会,也是时间风险。
液冷、电气和整柜系统,是最容易被普通人低估的一层
高密度 GPU 集群不是普通服务器。
功耗高,热密度高,机柜设计复杂。很多新一代 AI 服务器已经默认走液冷路线,传统空气冷却越来越吃力。
Vertiv 在 2026 年宣布参与 NVIDIA Vera Rubin DSX AI Factory reference design,提供电力和冷却相关的可仿真资产、接口和可重复基础设施模块。来源:Vertiv on NVIDIA Vera Rubin DSX AI factories
Eaton 在 2025 年公布用于 AI 数据中心的 800V DC 供电参考架构,并称其设计支持 NVIDIA 公布的 800V DC 架构。来源:Eaton 800 VDC architecture for AI factories
Supermicro 在 2026 年披露 Vera Rubin NVL72、HGX Rubin NVL8 和 Vera CPU 系统,并表示其 Vera Rubin NVL72 会使用新的 DCBBS 液冷组件,以支持机柜和集群级别的功耗与散热。来源:Supermicro Vera Rubin NVL72 and liquid cooling
这一层很适合 SmartLiving 的读者去理解。
因为它不是纯科技概念,也不是纯金融叙事。它是真实工程,真实设备,真实交付。
你可以把它看成 AI 工厂的水电装修。
没有这层,芯片再强也不能稳定运行。
Interactive Risk View
AI 第二圈动态风险雷达
点雷达点或下方风险项,查看为什么第二圈不是更安全,而是风险更分散。
合同关系怎么读,不要把公告直接当利润
下面这张表,比公司名单更有用。
| 关系 | 类型 | 说明 | 需要小心的点 | | --- | --- | --- | --- | | OpenAI + Oracle | 数据中心容量协议 | 4.5GW 额外 Stargate 容量 | 容量开发不等于已经通电 | | OpenAI + NVIDIA | 意向书 / 战略合作 | 至少 10GW NVIDIA 系统,NVIDIA 拟最多投资 $100B | 意向书不是最终合同,部署分多年 | | OpenAI + Broadcom | 定制加速器合作 | 10GW OpenAI 设计的 AI 加速器和网络系统 | 2026 下半年开始部署,收入确认有时间差 | | Anthropic + Amazon / AWS | 云、投资与 Trainium 合作 | Claude 训练和部署需求进入 AWS、Trainium 和数据中心容量 | Trainium 性能、利用率和合约经济性要持续验证 | | Google / Gemini + TPU / Google Cloud | 自研 TPU 与云基础设施 | Gemini 需求连接 TPU、AI Hypercomputer、Vertex AI 和 Google Cloud | 一部分价值留在 Google 内部,不一定外溢给公开供应商 | | Microsoft + Maia / Azure | 自研推理加速器 | Maia 连接 Azure、Microsoft Foundry、Copilot 和 OpenAI 相关工作负载 | 需要看真实部署规模和每美元性能改善 | | xAI + NVIDIA | Colossus 超算集群 | 100,000 颗 Hopper GPU 和 Spectrum-X 网络用于 Grok 模型 | xAI 非上市公司,公开财务透明度有限 | | Microsoft Copilot + Azure / OpenAI / NVIDIA | 应用需求回流云基础设施 | Copilot 类应用制造推理需求,Azure 承接 OpenAI 工作负载和 GPU 集群 | 要看应用收入能否覆盖基础设施成本 | | Meta + Broadcom | 定制芯片合作 | 多代 MTIA 芯片合作 | 更偏推理,不代表训练 GPU 立刻被替代 | | Microsoft + Constellation | 20 年 PPA | 支持 Crane Clean Energy Center 重启 | 核电监管、重启成本、并网时间 | | Google Cloud + NextEra | 能源和数据中心基础设施合作 | 多个 GW 级地点 | 许可、输电、资本开支和区域监管 | | NVIDIA + Vertiv / Schneider / Eaton / Trane | AI Factory 参考设计生态 | 电力、冷却、工程模块进入 NVIDIA 体系 | 参考设计不等于每家公司都拿到同等订单 | | NVIDIA + Supermicro | 整柜服务器和液冷系统 | Vera Rubin NVL72、HGX Rubin NVL8、DCBBS 液冷组件 | 交付质量、毛利、库存和客户集中度 |
这张表背后的原则很简单。
公告不是收入。
收入不是利润。
利润不是自由现金流。
自由现金流也不等于合理估值。
市场最容易在第二圈犯的错,就是看到一个大合同标题,直接把未来几年利润一次性放进今天的股价里。
普通投资者应该用这五个问题过滤 AI 第二圈
如果你研究这类公司,我会建议先问五个问题。
- [ ] 这家公司拿到的是订单、参考设计、合作意向,还是已经交付并确认收入?
- [ ] 它的客户是否过度集中在一两个超大买家?
- [ ] 它的毛利率会因为 AI 需求上升而改善,还是只是收入变大、资本开支也变大?
- [ ] 这家公司是否需要大量举债或提前投入,才能兑现 AI 项目?
- [ ] 它的估值是否已经把未来几年的增长都提前算进去了?
这五个问题比问「是不是 AI 概念」更有用。
因为第二圈公司的风险经常不是需求不存在,而是需求兑现太慢,建设成本太高,估值跑得太快。
这篇文章和你已有的 AI 股票仓位有什么关系
如果你已经在 AI 股票上有盈利,要看的不只是产业链。
卖出时的交易规费、短期和长期资本利得、NIIT、纽约州和纽约市税,也会影响你最后留下多少钱。可以接着读这篇:AI 股大赚后的清算日,2026 交易规费、资本利得税和纽约税账怎么算?
如果你关心的是自己买硬件跑本地模型,而不是买相关公司股票,可以看这篇:2026 本地 AI 硬件成本核算,买 NVIDIA 显卡还是大内存 Mac?
最后的结论
AI 第二圈值得研究。
但它不是更安全的第一圈替代品。
它是一条更长、更重、更慢的资本传导链。
GPU 是最亮的地方,电力是最硬的地方,HBM 和封装是最容易卡住的地方,液冷和整柜系统是最容易被普通人低估的地方。
真正精明的看法不是「下一只 NVIDIA 是谁」。
而是先看懂一张图。
钱从哪里出来,经过哪几层,哪些公司只是出现在新闻里,哪些公司真的能把项目交付成收入和现金流。
看懂这张图,才有资格继续讨论估值。
资料来源
- OpenAI, Stargate advances with 4.5 GW partnership with Oracle
- OpenAI, Oracle, and SoftBank expand Stargate with five new AI data center sites
- OpenAI and NVIDIA announce strategic partnership
- OpenAI and Broadcom announce strategic collaboration
- Anthropic, Powering the next generation of AI development with AWS
- AWS Trainium customers
- Google, Introducing Gemini
- Google Cloud, Introducing Cloud TPU v5p and AI Hypercomputer
- Microsoft, Maia 200
- NVIDIA, xAI Colossus supercomputer
- Microsoft Azure, NVIDIA GB300 NVL72 for OpenAI workloads
- Meta partners with Broadcom to co-develop custom AI silicon
- Micron HBM4 for NVIDIA Vera Rubin
- TSMC 2024 Annual Report
- NVIDIA Vera Rubin DSX AI Factory reference design
- IEA, Key Questions on Energy and AI
- Constellation, Crane Clean Energy Center announcement
- NextEra Energy and Google Cloud strategic partnership
- NVIDIA and Emerald AI join energy companies
- Vertiv on NVIDIA Vera Rubin DSX AI factories
- Eaton 800 VDC architecture for AI factories
- Supermicro Vera Rubin NVL72 and liquid cooling
免责声明: 本文仅供教育和信息参考,不构成投资、税务、法律或个人财务建议。文中提到的公司、合同、合作关系和官方公告,只用于说明 AI 基础设施资本开支的传导路径,不代表对任何证券、基金、ETF 或行业主题的买卖建议。AI 基础设施涉及技术、供应链、监管、融资、估值和执行风险,做任何投资决定前,请结合自己的财务状况并咨询合格专业人士。
SmartLiving 实用工具
继续用免费工具把日常决定算清楚。