NVIDIA GTC 2026:推理拐点到来,Agentic AI 工厂加速崛起
核心要点:
- 推理拐点到来:GTC 主题演讲指出,随着 AI 从预训练阶段迈向面向实时任务的智能体推理,算力需求正在发生大规模转变。
- NVIDIA Vera Rubin 平台:这一被称为“代际跃升”的平台包含七款全新芯片(包括 NVIDIA Vera CPU 和 NVIDIA Rubin GPU)以及五种专用机柜设计,旨在为全球最大规模的 AI 工厂提供动力。
- 解耦式推理:全新集成的 NVIDIA Groq 3 LPX 机柜与 Vera Rubin 平台协同,可将单位兆瓦的推理吞吐提升至最高 35 倍。
- “Moment of Claws”:NVIDIA 正通过 NVIDIA OpenShell 推动下一轮 AI 拐点的到来。作为一个开源运行时,OpenShell 使自主智能体能够在隔离沙箱中进行安全推理与执行操作。
价值 1 万亿美元的推理拐点
在 GTC 2026 上,主题演讲强调了 AI 正在从预训练模型阶段转向实时执行阶段。黄仁勋指出,这一转变正推动全球对 AI 基础设施需求出现惊人的跃升。
这种需求的倍增,源于智能体 AI 时代的到来。所谓智能体 AI,是指能够进行任务规划、调用工具并验证结果的系统。计算范式已不再停留在基于检索的阶段,而是正从生成式能力演进到以推理为核心,并进一步迈向智能体化。如今,随着 AI 智能体开始通过任务规划、任务拆解、推理与反思等迭代过程执行各类任务,推理算力需求在短短两年内已增长约 100 万倍。
Vera Rubin:AI 工厂的基础
NVIDIA 正式发布 Vera Rubin 平台。这是一套超级计算平台,可让多个机柜协同运行,形成一个大规模、统一且一致的计算系统,从而最大化每瓦功耗所产出的 token 数量。
- NVIDIA Groq 3 LPX 机柜:该机柜标志着加速计算迈入支持解耦式推理的新阶段。在这一架构中,Rubin GPU 负责 prefill、decode attention 以及大规模 KV cache 的生成,而 NVIDIA Groq LPU 则负责低时延的 decode 阶段,可为万亿参数模型带来最高达 10 倍的收入机会。
- Vera CPU 机柜:这是全球首款专为智能体 AI 打造的处理器平台。相较于传统 CPU,它可实现两倍的效率提升,并将处理速度提高 50%。凭借 88 个定制 Olympus 核心和 1.5TB LPDDR5X 内存,它能够提供智能体运行代码和验证结果所需的单线程性能。
- NVIDIA BlueField-4 STX 机柜:这是一套原生面向 AI 的存储基础设施,将数据视为“上下文记忆”。借助 NVIDIA DOCA Memos™ 框架,它可将长上下文推理场景下的推理吞吐提升最高 5 倍。
NVIDIA OpenShell:开启“Moment of Claws”
2026 年初,OpenClaw 的出现引发了业界对自主智能体的广泛关注。这类智能体能够执行多步骤工作流,并通过与本地文件及外部工具交互,推动 AI 系统从一次性响应模式走向持续运行、以执行为导向的新阶段。
为支持这些最先进智能体的安全部署,NVIDIA 推出 NVIDIA OpenShell,以迎接这一“Moment of Claws”。OpenShell 是一个开源运行时,专门用于治理智能体的执行方式。
我们也正在与 NVIDIA 合作推进 NVIDIA NemoClaw。这是一套开源技术栈,可通过单条命令,更安全地简化 OpenClaw 常驻助手的运行。作为 NVIDIA Agent Toolkit 的一部分,它会安装 NVIDIA OpenShell 运行时一个用于运行自主智能体的安全环境,以及包括 NVIDIA Nemotron 在内的开源模型。
NVIDIA OpenShell 位于智能体与底层基础设施之间,能够在隔离沙箱中运行各类代码智能体,包括 OpenClaw、Claude Code、Cursor 和 Codex,而无需修改任何代码。所有操作都会在基础设施层按照策略进行强制执行,从而为长时间运行的智能体工作流提供隐私与安全保障。

来源: NVIDIA GTC2026 主题演讲
随着全球智能体基础设施不断演进,Bitdeer AI 也正在亚太地区积极推进安全、可扩展的智能体基础设施建设。如今,开发者和企业已可在 build.nvidia.com 上看到 Bitdeer AI,作为支持这类智能体底层模型运行的基础设施提供商。
我们也很高兴地宣布,Nemotron 3 Super 已上线 Bitdeer AI 平台。作为 OpenClaw 当前表现最出色的开源模型之一,Nemotron 3 Super 具备支持复杂自主工作流所需的高阶推理与任务规划能力。
立即体验从 build.nvidia.com 开始构建属于你的安全自主智能体:
- 登陆build.nvidia.com 上访问 NVIDIA OpenShell.
- 无缝集成来自 Bitdeer AI 的前沿开源模型端点,为长时间运行的智能体提供算力支持。
依托部署于先进 AI 数据中心的 NVIDIA GB200 NVL72 系统,Bitdeer AI Cloud 提供运行自主进化型智能体所需的高性能基础设施,助力 NVIDIA OpenShell 场景下的大规模应用落地。通过将安全的运行时治理能力与高性能 AI 云平台相结合,我们帮助开发者构建具备更强隐私保障与基础设施可靠性的下一代 AI 应用。