NVIDIA GTC 2026：推理拐点到来，Agentic AI 工厂加速崛起

Tey Rui Jie

Mar 24, 2026 • 6 min read

核心要点：

推理拐点到来：GTC 主题演讲指出，随着 AI 从预训练阶段迈向面向实时任务的智能体推理，算力需求正在发生大规模转变。
NVIDIA Vera Rubin 平台：这一被称为“代际跃升”的平台包含七款全新芯片（包括 NVIDIA Vera CPU 和 NVIDIA Rubin GPU）以及五种专用机柜设计，旨在为全球最大规模的 AI 工厂提供动力。
解耦式推理：全新集成的 NVIDIA Groq 3 LPX 机柜与 Vera Rubin 平台协同，可将单位兆瓦的推理吞吐提升至最高 35 倍。
“Moment of Claws”：NVIDIA 正通过 NVIDIA OpenShell 推动下一轮 AI 拐点的到来。作为一个开源运行时，OpenShell 使自主智能体能够在隔离沙箱中进行安全推理与执行操作。

价值 1 万亿美元的推理拐点

在 GTC 2026 上，主题演讲强调了 AI 正在从预训练模型阶段转向实时执行阶段。黄仁勋指出，这一转变正推动全球对 AI 基础设施需求出现惊人的跃升。

这种需求的倍增，源于智能体 AI 时代的到来。所谓智能体 AI，是指能够进行任务规划、调用工具并验证结果的系统。计算范式已不再停留在基于检索的阶段，而是正从生成式能力演进到以推理为核心，并进一步迈向智能体化。如今，随着 AI 智能体开始通过任务规划、任务拆解、推理与反思等迭代过程执行各类任务，推理算力需求在短短两年内已增长约 100 万倍。

Vera Rubin：AI 工厂的基础

NVIDIA 正式发布 Vera Rubin 平台。这是一套超级计算平台，可让多个机柜协同运行，形成一个大规模、统一且一致的计算系统，从而最大化每瓦功耗所产出的 token 数量。

NVIDIA Groq 3 LPX 机柜：该机柜标志着加速计算迈入支持解耦式推理的新阶段。在这一架构中，Rubin GPU 负责 prefill、decode attention 以及大规模 KV cache 的生成，而 NVIDIA Groq LPU 则负责低时延的 decode 阶段，可为万亿参数模型带来最高达 10 倍的收入机会。
Vera CPU 机柜：这是全球首款专为智能体 AI 打造的处理器平台。相较于传统 CPU，它可实现两倍的效率提升，并将处理速度提高 50%。凭借 88 个定制 Olympus 核心和 1.5TB LPDDR5X 内存，它能够提供智能体运行代码和验证结果所需的单线程性能。
NVIDIA BlueField-4 STX 机柜：这是一套原生面向 AI 的存储基础设施，将数据视为“上下文记忆”。借助 NVIDIA DOCA Memos™ 框架，它可将长上下文推理场景下的推理吞吐提升最高 5 倍。

NVIDIA OpenShell：开启“Moment of Claws”

2026 年初，OpenClaw 的出现引发了业界对自主智能体的广泛关注。这类智能体能够执行多步骤工作流，并通过与本地文件及外部工具交互，推动 AI 系统从一次性响应模式走向持续运行、以执行为导向的新阶段。

为支持这些最先进智能体的安全部署，NVIDIA 推出 NVIDIA OpenShell，以迎接这一“Moment of Claws”。OpenShell 是一个开源运行时，专门用于治理智能体的执行方式。

我们也正在与 NVIDIA 合作推进 NVIDIA NemoClaw。这是一套开源技术栈，可通过单条命令，更安全地简化 OpenClaw 常驻助手的运行。作为 NVIDIA Agent Toolkit 的一部分，它会安装 NVIDIA OpenShell 运行时一个用于运行自主智能体的安全环境，以及包括 NVIDIA Nemotron 在内的开源模型。

NVIDIA OpenShell 位于智能体与底层基础设施之间，能够在隔离沙箱中运行各类代码智能体，包括 OpenClaw、Claude Code、Cursor 和 Codex，而无需修改任何代码。所有操作都会在基础设施层按照策略进行强制执行，从而为长时间运行的智能体工作流提供隐私与安全保障。

来源: NVIDIA GTC2026 主题演讲

随着全球智能体基础设施不断演进，Bitdeer AI 也正在亚太地区积极推进安全、可扩展的智能体基础设施建设。如今，开发者和企业已可在 build.nvidia.com 上看到 Bitdeer AI，作为支持这类智能体底层模型运行的基础设施提供商。

我们也很高兴地宣布，Nemotron 3 Super 已上线 Bitdeer AI 平台。作为 OpenClaw 当前表现最出色的开源模型之一，Nemotron 3 Super 具备支持复杂自主工作流所需的高阶推理与任务规划能力。

立即体验从 build.nvidia.com 开始构建属于你的安全自主智能体:

登陆build.nvidia.com 上访问 NVIDIA OpenShell.
无缝集成来自 Bitdeer AI 的前沿开源模型端点，为长时间运行的智能体提供算力支持。

依托部署于先进 AI 数据中心的 NVIDIA GB200 NVL72 系统，Bitdeer AI Cloud 提供运行自主进化型智能体所需的高性能基础设施，助力 NVIDIA OpenShell 场景下的大规模应用落地。通过将安全的运行时治理能力与高性能 AI 云平台相结合，我们帮助开发者构建具备更强隐私保障与基础设施可靠性的下一代 AI 应用。

来源: https://blogs.nvidia.com/blog/gtc-2026-news/