多智能体AI经济学如何影响企业自动化
创始人
2026-03-13 21:55:56
0

管理多智能体AI的经济性已成为决定现代企业自动化工作流程财务可行性的关键因素。

企业从标准聊天界面向多智能体应用发展时,面临两个主要制约因素。首先是思维税问题:复杂的自主智能体需要在每个阶段进行推理,这使得在每个子任务中依赖大型架构变得过于昂贵且速度缓慢,无法满足企业实际使用需求。

上下文爆炸是第二个障碍:这些先进工作流程产生的Token数量比标准格式多出1500%,因为每次交互都需要重新发送完整的系统历史、中间推理和工具输出。在扩展任务中,这种Token量级推高了费用并导致目标漂移,即智能体偏离其初始目标的情况。

为解决这些治理和效率障碍,硬件和软件开发商正在发布专门针对企业基础设施的高度优化工具。

NVIDIA最近推出了Nemotron 3 Super,这是一个拥有1200亿参数(其中120亿保持激活状态)的开放架构,专门设计用于执行复杂的智能体AI系统。

NVIDIA的框架立即可用,融合了先进的推理功能,帮助自主智能体高效准确地完成任务,以改善企业自动化。该系统采用混合专家架构,结合三项重大创新,相比前代Nemotron Super模型,吞吐量提升5倍,准确率提升2倍。在推理过程中,1200亿参数中只有120亿处于激活状态。

Mamba层提供4倍的内存和计算效率,而标准Transformer层处理复杂的推理需求。潜在技术通过在Token生成期间以一个专家的成本调用四个专家,提升了准确性。系统还能同时预测多个未来词汇,将推理速度提升3倍。

该架构在Blackwell平台上运行,利用NVFP4精度。这种设置减少了内存需求,比Hopper系统上的FP8配置快4倍,且不牺牲准确性。

该系统提供100万Token的上下文窗口,允许智能体将整个工作流状态保存在内存中,直接解决目标漂移风险。软件开发智能体可以同时将整个代码库加载到上下文中,实现端到端代码生成和调试,无需文档分割。

在金融分析中,系统可以将数千页报告加载到内存中,通过消除在冗长对话中重新推理的需求来提高效率。高精度工具调用确保自主智能体可靠地导航庞大的功能库,防止在网络安全自主安全编排等高风险环境中出现执行错误。

行业领导者包括Amdocs、Palantir、Cadence、达索系统和西门子,正在部署和定制该模型,以自动化电信、网络安全、半导体设计和制造等领域的工作流程。

CodeRabbit、Factory和Greptile等软件开发平台正将其与专有模型集成,以更低成本实现更高精度。Edison Scientific和Lila Sciences等生命科学公司将使用它为深度文献搜索、数据科学和分子理解的智能体提供支持。

该架构还推动AI-Q智能体在DeepResearch Bench和DeepResearch Bench II排行榜上名列榜首,突显了其在大型文档集中进行多步骤研究同时保持推理连贯性的能力。

最后,该模型在Artificial Analysis的效率和开放性方面排名第一,在同等规模模型中准确率领先。

为处理多智能体系统内的复杂子任务,部署灵活性对推动企业自动化的领导者来说仍是重点。

NVIDIA在许可许可下发布了开放权重模型,让开发者可以在工作站、数据中心或云环境中部署和定制它。它被打包为NVIDIA NIM微服务,以支持从本地系统到云端的广泛部署。

该架构使用前沿推理模型生成的合成数据进行训练。NVIDIA公布了完整方法论,包括超过10万亿Token的预训练和后训练数据集、15个强化学习训练环境和评估配方。研究人员可以进一步微调模型或使用NeMo平台构建自己的模型。

任何规划数字化推广的高管都必须提前解决上下文爆炸和思维税问题,以防止智能体工作流程中的目标漂移和成本超支。建立全面的架构监督确保这些复杂智能体与企业指令保持一致,产生可持续的效率提升并推进整个组织的企业自动化。

Q&A

Q1:什么是思维税和上下文爆炸问题?

A:思维税指复杂智能体在每个阶段都需要推理,使用大型架构处理每个子任务变得过于昂贵且缓慢。上下文爆炸指多智能体工作流程产生的Token比标准格式多1500%,因为每次交互都需要重发完整系统历史、推理过程和工具输出,导致成本上升和目标漂移。

Q2:NVIDIA Nemotron 3 Super有什么技术特点?

A:该系统拥有1200亿参数但只有120亿激活,采用混合专家架构。Mamba层提供4倍内存和计算效率,Transformer层处理复杂推理。潜在技术以一个专家成本调用四个专家提升准确性,同时预测多个词汇使推理速度提升3倍,并提供100万Token上下文窗口。

Q3:哪些企业正在使用这项技术?

A:行业领导者包括Amdocs、Palantir、Cadence、达索系统和西门子,用于自动化电信、网络安全、半导体设计和制造工作流程。软件平台如CodeRabbit、Factory、Greptile正在集成该技术,生命科学公司Edison Scientific和Lila Sciences将其用于文献搜索、数据科学和分子研究。

相关内容

未来五年如何稳增长、求创新...
3月13日,“十五五”规划纲要发布。未来五年要夯实哪些基础?要朝什...
2026-03-14 10:49:01
如何判断货币政策取向?权威...
“近年来,我国进一步向价格型货币政策调控框架转变,公开市场操作量更...
2026-03-14 03:43:23
如何抢占“人工智能+”行业...
从两会“高频词”看国家战略 如何抢占“人工智能+”行业风口? ...
2026-03-14 02:22:08
当你的电脑有了“主见”,“...
最近,“赛博养虾”风潮席卷科技圈,似乎不“养虾”就“OUT”了。此...
2026-03-13 23:25:40
超市上演“大败局”,为何河...
胖东来领衔,“豫超”火爆背后:电商并非实体零售“杀手”。 作者丨路...
2026-03-13 23:21:14
以案为鉴:砂石交易中的“隐...
封面新闻记者 姚瑞鹏 一笔笔不开发票的现金交易,一条条汇入私人账户...
2026-03-13 23:19:43

热门资讯

原创 如... 肺是人体非常重要的器官,空气中的很多灰尘和垃圾都会随空气进入肺部,所以肺部的清洁是非常重要的。我们可...
孕妈检测出胎儿没有“胎心”究竟... 原标题:孕妈检测出胎儿没有“胎心”究竟为何?多半是这4种原因,预防下 昨天小樱...
耳聋耳背知识分享-----耳朵... 耳朵听力下降恢复方法首先要找出听力下降的病因,其次针对病因进行对症治疗。 耳朵听力下降,如何恢复听...
激光术后护理指南:如何科学恢复... 二氧化碳激光是一种常用于去除瘢痕、色素沉着、皱纹和其他皮肤问题的治疗方法。它通过发射高能量的二氧化碳...
如何有效应对低血压问题,提升生... 血压低,这个问题在生活中并不罕见。很多人可能会觉得,血压低就像是个小毛病,不用太在意。但实际上,低血...
孩子自控力差?家长如何引导培养 孩子自控力差?家长如何引导培养 在孩子的成长过程中,自控力是一项至关重要的能力。它关乎孩子的学业表现...
郑州银行大额存单利率:1、活期... 导读2022郑州银行大额存单利率一、存款利率:1、活期存款:0.3%2、整存整取:三个月1.60%,...
原创 婴... 在宝宝的成长过程中,奶粉作为重要的营养来源,其选择至关重要。那么,什么样的婴儿奶粉比较好呢?奶粉的营...
存款利息怎么算?湖南农商行存款... 导读湖南农商行存款利息怎么算?湖南农商行作为湖南最大的股份制银行,它是一家地方性、集约化、国际化、股...
宝宝不吸奶瓶的问题如何解决 原标题:宝宝不吸奶瓶的问题如何解决 宝宝出生后不久,有些妈妈因为要上班而不得不...