专为智能体而生:Bitdeer AI Cloud已支持NVIDIA Nemotron 3 Super
Bitdeer AI Model Studio 现已支持 NVIDIA-Nemotron-3-Super-120B-A12B,为开发者带来一款面向高级推理、长上下文理解与 Agentic AI 开发的全新开放模型。
NVIDIA Nemotron 3 Super 专为复杂多智能体应用而设计,在提供强大推理能力的同时兼顾计算效率。如今,开发者可直接在 Bitdeer AI 的高性能 NVIDIA GPU 基础设施上探索并运行该模型,更高效地开展实验、部署应用,并扩展高要求的 AI 工作负载。
什么是 NVIDIA Nemotron 3 Super
NVIDIA Nemotron 3 Super 是 Nemotron 3 开放模型家族中的重要成员,专为复杂多智能体应用场景优化。
NVIDIA-Nemotron-3-Super-120B-A12B该模型拥有 120B 总参数,采用 Mamba 与 Transformer 混合的专家混合架构(Mixture-of-Experts, MoE),在推理时仅激活 12B 参数。这一架构设计使其在复杂推理任务中具备出色表现,同时保持适合生产级部署的推理效率。
Nemotron 3 Super 的突出之处,在于它并非只是面向通用聊天场景进行优化,而是针对更复杂的 Agentic AI 工作负载进行设计。这类任务通常要求模型能够在超长上下文中进行推理,准确调用工具,并支持多步骤任务执行与智能体协作。
关键规格:
- 模型规模:120B 总参数,推理时激活 12B 参数
- 模型架构:Mamba-2、状态空间模型与 Transformer 结合的专家混合架构
- 上下文窗口:最高支持 1M tokens
- 准确率表现:在同规模模型中,于 Artificial Analysis Intelligence Index 上取得领先表现
- 最低 GPU 需求:2 × NVIDIA H100 80GB
- 多语言支持:英语、法语、德语、意大利语、日语、西班牙语、中文
为什么 Nemotron 3 Super 适合 Agentic AI
随着 AI 应用从单轮对话逐步走向更复杂的智能体系统,模型能力的要求也在不断提高。Agentic AI 系统不仅需要具备强大的推理、编码和长上下文分析能力,还必须足够高效,能够支撑生产环境中的持续运行。
与传统聊天式交互相比,多智能体工作流往往会产生更多 token 消耗。在任务执行过程中,不同智能体会反复交换对话历史、工具输出和中间推理结果,随着任务变长,上下文规模会不断扩大。这不仅会推高推理成本,也会带来通信开销和上下文漂移等问题。
NVIDIA Nemotron 3 Super 正是围绕这些核心挑战进行架构设计。
首先,Mamba 与 Transformer 的混合架构 提升了模型处理长序列任务的效率,同时保留了 Transformer 在复杂推理中的优势,使模型在长上下文任务中兼顾性能与准确率。
其次,专家混合架构 会根据任务动态选择不同专家网络参与推理,在不按比例增加计算成本的前提下进一步提升模型性能。这对于需要持续运行的大规模智能体系统尤为关键。
第三,Nemotron 3 Super 采用 完整开放模型栈,包括开放权重、开放训练数据集以及开放训练配方。这意味着开发者可以在自有基础设施上进行定制化训练与微调,同时更好地掌控数据隐私与安全。

展示 Mamba-2 与 MoE 成对模块重复排列,并与注意力层交替插入的层级结构示意图。
来源: NVIDIA
综合来看,Nemotron 3 Super 非常适合用于构建复杂多智能体系统和企业级 AI 工作流。该模型特别针对 工具调用、多步骤推理与智能体编排 进行了优化,而这些能力正是新一代 AI Agent 系统的关键基础。随着越来越多应用需要模型与外部工具、API 及数据源协同完成任务,Nemotron 3 Super 的价值也变得更加突出。
对于企业级 Agentic AI 应用而言,模型不仅要“会回答”,更要能够在复杂任务中持续保持上下文、调用外部能力并完成多阶段决策。
Nemotron 3 Super 的架构设计使其能够更好地支持以下场景:
- 在长文档、代码库或多轮对话历史中保持推理连贯性
- 在复杂工作流中更准确地执行工具调用
- 在多智能体协作任务中降低上下文膨胀带来的成本压力
- 在企业环境中实现更高效、更可控的模型定制与部署
这使其不仅适用于实验性应用,也更适合逐步走向真实业务生产场景。
基准测试表现
Nemotron 3 Super 在多项 Agentic AI 与推理类基准测试中展现出领先准确率,同时保持了较高吞吐效率。

Nemotron 3 Super 与同规模开源模型基准准确率对比
来源: NVIDIA
从公开表现来看,该模型在以下关键能力上具备较强优势:
- 指令遵循能力: 能够更好地理解复杂任务要求,并按预期执行
- 代码能力:在编码、调试及代码相关任务中表现出色
- 工具使用能力: 能够更可靠地完成工具调用,提升复杂任务执行成功率
- 长上下文推理能力:适合处理跨长文档、多步骤、跨来源信息整合等任务
这些能力共同奠定了 Nemotron 3 Super 在智能体系统和复杂企业应用中的实用价值。
企业级应用场景
Nemotron 3 Super 面向复杂企业 AI 应用而设计,尤其适用于需要多智能体推理与大规模知识上下文处理的任务。以下是几个具有代表性的应用方向。
软件开发:
凭借较强的代码能力和工具调用能力,以及对大型代码库的上下文理解能力,Nemotron 3 Super 可以支持端到端的软件开发工作流,包括代码生成、自动调试与测试等任务。这使其非常适合用于 AI 编程助手、开发自动化以及工程协作类应用。
深度研究与智能搜索:
Nemotron 3 Super 在企业研究类工作流中具备良好潜力,能够支持高质量报告生成、精确信息检索和长文档事实回溯。这类能力可广泛应用于文献综述、竞争情报分析、知识发现和研究自动化等场景。
网络安全:
在网络安全场景中,工具调用的准确率至关重要。Nemotron 3 Super 能帮助自主智能体更可靠地选择并调用合适工具,从而降低高风险环境中的执行错误。这对于安全运营自动化、威胁分析和自动化安全工作流具有现实意义。
金融服务:
在金融行业中,模型往往需要一次性处理大量财报、研究资料和长篇文档,并在较长任务链路中持续保持上下文。Nemotron 3 Super 能够帮助分析型智能体提升任务连续性,从而提高分析效率与判断准确率,适用于投研支持、财务分析和知识密集型工作流。
通过 API 在 Bitdeer AI Model Studio 上快速运行 Nemotron 3 Super
Bitdeer AI Model Studio 是一个无服务器推理平台,开发者可通过简洁的 API 直接访问并运行 Nemotron 3 Super 等基础模型。
第一步:选择模型
登录 Bitdeer AI Model Studio,在模型列表中找到 NVIDIA-Nemotron-3-Super-120B-A12B,即可开始用于相关 AI 工作负载。当前定价为:输入价格:$0.30 / M tokens,输出价格:$0.80 / M tokens。

第二步:生成 API Key
在调用模型前,你需要先生成 API Key。进入左侧导航栏中的 API Keys 页面,点击 Generate API Key 即可创建。
第三步:通过 API 调用模型
创建 API Key 后,即可通过 Bitdeer AI 推理 API 调用该模型。只需在请求头中加入 API Key,即可将 Nemotron 3 Super 集成到你的 AI 应用与工作流中。
借助 Model Studio 与 API 接入能力,开发者能够更快开始实验,并将 Nemotron 3 Super 用于实际业务场景。
凭借强大的推理能力、超长上下文支持以及高效的混合架构,NVIDIA-Nemotron-3-Super-120B-A12B 为构建下一代 AI 应用和智能体系统提供了坚实基础。

结语
无论是复杂推理任务、代码相关任务、大规模知识处理,还是多智能体协作工作流,Nemotron 3 Super 都能够帮助开发者以更高效率和更大灵活性应对高要求 AI 负载。
如果你正在寻找一款能够支撑高级 Agentic AI 应用的开放模型,现在就前往 Bitdeer AI Model Studio,体验 NVIDIA Nemotron 3 Super,探索它如何加速你的下一代 AI 应用开发。