AI Applications

专为智能体而生：Bitdeer AI Cloud已支持NVIDIA Nemotron 3 Super

Taylor Ye

Mar 14, 2026 • 9 min read

Bitdeer AI Model Studio 现已支持 NVIDIA-Nemotron-3-Super-120B-A12B，为开发者带来一款面向高级推理、长上下文理解与 Agentic AI 开发的全新开放模型。

NVIDIA Nemotron 3 Super 专为复杂多智能体应用而设计，在提供强大推理能力的同时兼顾计算效率。如今，开发者可直接在 Bitdeer AI 的高性能 NVIDIA GPU 基础设施上探索并运行该模型，更高效地开展实验、部署应用，并扩展高要求的 AI 工作负载。

什么是 NVIDIA Nemotron 3 Super

NVIDIA Nemotron 3 Super 是 Nemotron 3 开放模型家族中的重要成员，专为复杂多智能体应用场景优化。

NVIDIA-Nemotron-3-Super-120B-A12B该模型拥有 120B 总参数，采用 Mamba 与 Transformer 混合的专家混合架构（Mixture-of-Experts, MoE），在推理时仅激活 12B 参数。这一架构设计使其在复杂推理任务中具备出色表现，同时保持适合生产级部署的推理效率。

Nemotron 3 Super 的突出之处，在于它并非只是面向通用聊天场景进行优化，而是针对更复杂的 Agentic AI 工作负载进行设计。这类任务通常要求模型能够在超长上下文中进行推理，准确调用工具，并支持多步骤任务执行与智能体协作。

关键规格:

模型规模：120B 总参数，推理时激活 12B 参数
模型架构：Mamba-2、状态空间模型与 Transformer 结合的专家混合架构
上下文窗口：最高支持 1M tokens
准确率表现：在同规模模型中，于 Artificial Analysis Intelligence Index 上取得领先表现
最低 GPU 需求：2 × NVIDIA H100 80GB
多语言支持：英语、法语、德语、意大利语、日语、西班牙语、中文

为什么 Nemotron 3 Super 适合 Agentic AI

随着 AI 应用从单轮对话逐步走向更复杂的智能体系统，模型能力的要求也在不断提高。Agentic AI 系统不仅需要具备强大的推理、编码和长上下文分析能力，还必须足够高效，能够支撑生产环境中的持续运行。

与传统聊天式交互相比，多智能体工作流往往会产生更多 token 消耗。在任务执行过程中，不同智能体会反复交换对话历史、工具输出和中间推理结果，随着任务变长，上下文规模会不断扩大。这不仅会推高推理成本，也会带来通信开销和上下文漂移等问题。

NVIDIA Nemotron 3 Super 正是围绕这些核心挑战进行架构设计。

首先，Mamba 与 Transformer 的混合架构提升了模型处理长序列任务的效率，同时保留了 Transformer 在复杂推理中的优势，使模型在长上下文任务中兼顾性能与准确率。

其次，专家混合架构会根据任务动态选择不同专家网络参与推理，在不按比例增加计算成本的前提下进一步提升模型性能。这对于需要持续运行的大规模智能体系统尤为关键。

第三，Nemotron 3 Super 采用完整开放模型栈，包括开放权重、开放训练数据集以及开放训练配方。这意味着开发者可以在自有基础设施上进行定制化训练与微调，同时更好地掌控数据隐私与安全。

展示 Mamba-2 与 MoE 成对模块重复排列，并与注意力层交替插入的层级结构示意图。

来源: NVIDIA

综合来看，Nemotron 3 Super 非常适合用于构建复杂多智能体系统和企业级 AI 工作流。该模型特别针对工具调用、多步骤推理与智能体编排进行了优化，而这些能力正是新一代 AI Agent 系统的关键基础。随着越来越多应用需要模型与外部工具、API 及数据源协同完成任务，Nemotron 3 Super 的价值也变得更加突出。

对于企业级 Agentic AI 应用而言，模型不仅要“会回答”，更要能够在复杂任务中持续保持上下文、调用外部能力并完成多阶段决策。

Nemotron 3 Super 的架构设计使其能够更好地支持以下场景：

在长文档、代码库或多轮对话历史中保持推理连贯性
在复杂工作流中更准确地执行工具调用
在多智能体协作任务中降低上下文膨胀带来的成本压力
在企业环境中实现更高效、更可控的模型定制与部署

这使其不仅适用于实验性应用，也更适合逐步走向真实业务生产场景。

基准测试表现

Nemotron 3 Super 在多项 Agentic AI 与推理类基准测试中展现出领先准确率，同时保持了较高吞吐效率。

https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-BF16/resolve/main/accuracy_chart.png

Nemotron 3 Super 与同规模开源模型基准准确率对比

来源: NVIDIA

从公开表现来看，该模型在以下关键能力上具备较强优势：

指令遵循能力：能够更好地理解复杂任务要求，并按预期执行
代码能力：在编码、调试及代码相关任务中表现出色
工具使用能力：能够更可靠地完成工具调用，提升复杂任务执行成功率
长上下文推理能力：适合处理跨长文档、多步骤、跨来源信息整合等任务

这些能力共同奠定了 Nemotron 3 Super 在智能体系统和复杂企业应用中的实用价值。

企业级应用场景

Nemotron 3 Super 面向复杂企业 AI 应用而设计，尤其适用于需要多智能体推理与大规模知识上下文处理的任务。以下是几个具有代表性的应用方向。

软件开发：

凭借较强的代码能力和工具调用能力，以及对大型代码库的上下文理解能力，Nemotron 3 Super 可以支持端到端的软件开发工作流，包括代码生成、自动调试与测试等任务。这使其非常适合用于 AI 编程助手、开发自动化以及工程协作类应用。

深度研究与智能搜索：

Nemotron 3 Super 在企业研究类工作流中具备良好潜力，能够支持高质量报告生成、精确信息检索和长文档事实回溯。这类能力可广泛应用于文献综述、竞争情报分析、知识发现和研究自动化等场景。

网络安全：

在网络安全场景中，工具调用的准确率至关重要。Nemotron 3 Super 能帮助自主智能体更可靠地选择并调用合适工具，从而降低高风险环境中的执行错误。这对于安全运营自动化、威胁分析和自动化安全工作流具有现实意义。

金融服务：

在金融行业中，模型往往需要一次性处理大量财报、研究资料和长篇文档，并在较长任务链路中持续保持上下文。Nemotron 3 Super 能够帮助分析型智能体提升任务连续性，从而提高分析效率与判断准确率，适用于投研支持、财务分析和知识密集型工作流。

通过 API 在 Bitdeer AI Model Studio 上快速运行 Nemotron 3 Super

Bitdeer AI Model Studio 是一个无服务器推理平台，开发者可通过简洁的 API 直接访问并运行 Nemotron 3 Super 等基础模型。

第一步：选择模型

登录 Bitdeer AI Model Studio，在模型列表中找到 NVIDIA-Nemotron-3-Super-120B-A12B，即可开始用于相关 AI 工作负载。当前定价为：输入价格：$0.30 / M tokens，输出价格：$0.80 / M tokens。

第二步：生成 API Key

在调用模型前，你需要先生成 API Key。进入左侧导航栏中的 API Keys 页面，点击 Generate API Key 即可创建。

第三步：通过 API 调用模型

创建 API Key 后，即可通过 Bitdeer AI 推理 API 调用该模型。只需在请求头中加入 API Key，即可将 Nemotron 3 Super 集成到你的 AI 应用与工作流中。

借助 Model Studio 与 API 接入能力，开发者能够更快开始实验，并将 Nemotron 3 Super 用于实际业务场景。

凭借强大的推理能力、超长上下文支持以及高效的混合架构，NVIDIA-Nemotron-3-Super-120B-A12B 为构建下一代 AI 应用和智能体系统提供了坚实基础。

结语

无论是复杂推理任务、代码相关任务、大规模知识处理，还是多智能体协作工作流，Nemotron 3 Super 都能够帮助开发者以更高效率和更大灵活性应对高要求 AI 负载。

如果你正在寻找一款能够支撑高级 Agentic AI 应用的开放模型，现在就前往 Bitdeer AI Model Studio，体验 NVIDIA Nemotron 3 Super，探索它如何加速你的下一代 AI 应用开发。