强化Agent能力,为何成为国产基础大模型2026年重要发展方向?
创始人
2026-04-09 00:19:02
0

近期,国产大模型动作频频。

4月2日,阿里发布千问新一代大语言模型Qwen3.6-Plus。4月8日,DeepSeek(深度求索)上线专家模式,这是DeepSeek走红以来首次在产品端引入模式分层设计,此前3月份,DeepSeek释放了和Agent(智能体)相关多个岗位的招聘需求。

《每日经济新闻》记者注意到,不论是阿里千问还是DeepSeek大模型,都在强化基础大模型Agent的能力。2026年初,以OpenClaw(一款开源人工智能体框架,俗称“龙虾”)为代表的“龙虾热”火爆国内外,如果说2025年还是“千模混战”,2026年AI(人工智能)主战场已全面转向智能体,Agent 对Token(词元)的消耗正以百倍、千倍速度狂飙。

IDC(国际数据公司)中国研究总监卢言霞向《每日经济新闻》记者表示,强化Agent能力是基础大模型2026年的重要发展方向,可能包括深度研究、智能办公、AI代码助手等通用场景。

中科院计算所客座博士生导师、中国计算机学会数字金融分会常务执委白硕在接受《每日经济新闻》记者采访时表示,随着AI应用爆发,对基础大模型Agent能力,未来将更重视在Harness Engineering(直译为驾驭工程)领域的提升。据了解,Harness Engineering是一个不强调模型性能,更强调工程环境,通过让“驾驭模型的系统环境”更专业而提升使用效果的范式。

下一代OpenClaw将支持视频生成

有“龙虾之父”之称的OpenClaw创始人彼得·斯坦伯格(Peter Steinberger)近日在社交平台宣称,下一代OpenClaw智能体产品将迎来两大核心升级——全新融入AI视频生成能力,并成为全球首个官方适配阿里千问大模型的智能体框架。

4月2日,阿里发布千问新一代大语言模型Qwen3.6-Plus,其中最引人注目的是,新模型显著增强了模型的智能体编程能力。在代码智能体领域以及通用智能体与工具使用方面,新模型表现突出。

4月4日,OpenRouter官方数据显示,Qwen3.6-Plus的日调用量突破1.4万亿Token。

Agent对Token的消耗正以前所未有的速度激增。国家数据局局长刘烈宏披露了一组数据,到今年3月,我国日均词元调用量已超过140万亿,相比2024年初的1000亿增长1000多倍,相比2025年底的100万亿,3个月时间又增长40%多。

在英伟达GTC开发者大会上,黄仁勋给出了一个极具冲击力的定义:Token是AI时代的新大宗商品,是新货币,也是衡量企业竞争力的核心标尺。

而OpenClaw这类Agent产品彻底改变了AI交互形态,使其能落地完成复杂任务,也让Token需求迎来爆发式增长。

不只是阿里千问基础大模型强化了Agent能力,DeepSeek通用大模型自2025年以来也强化了Agent能力。

《每日经济新闻》记者注意到,在DeepSeek官网上,3月24日发布的一系列招聘岗位中,有不少和Agent相关的岗位。譬如Agent全栈开发工程师、Agent深度学习算法研究员、Agent数据策略工程师等。

2025年12月,DeepSeek更新V3.2正式版,就强调其新模型强化Agent能力,融入思考推理。在这个版本的模型中,DeepSeek提出了一种大规模Agent训练数据合成方法,构造了大量“难解答,易验证”的强化学习任务(“1800+”环境,“85000+”复杂指令),大幅提高了模型的泛化能力。

专家模式具备领域深度增强等特点

当前,AI Agent(人工智能体)能力很大程度上依赖于基础大模型能力的提升,基础大模型提供核心能力,而Agent通过系统化设计将这些能力转化为实际应用价值,国产基础大模型正在强化Agent能力。

横向对比来看,不论是千问大模型还是DeepSeek,均实现支持高达1M Tokens(100万个词元)上下文长度,大模型在长文档、多轮对话信息提取上更精准。

卢言霞认为,当前基础大模型竞争的关键是编程能力、智能体能力等。强化Agent能力是基础大模型2026年的重要发展方向,可能包括深度研究、智能办公、AI代码助手等通用场景。

在AI应用端,浙江华通云数据科技有限公司副总裁林建龙在接受《每日经济新闻》记者采访时坦言,当前AI Agent仍面临一些问题。譬如大多数AI系统仍然停留在“工具”“技能”层面,无法真正成为企业的“数字化员工”。传统工作流编排和简单对话系统虽然能够完成一些预定义的任务,但缺乏深度理解业务场景、独立思考和持续学习的能力,难以满足企业复杂多变的业务需求。

林建龙表示,未来的AI Agent不是简单的工具,而是一个基于大模型之上的各个行业领域专家。这种专家Agent具备以下核心特征:第一,具备深厚的行业专业知识,能够理解并处理复杂的业务问题;第二,能够深度融入企业业务流程,与现有系统无缝对接;第三,具备持续学习和自我优化能力,能够在实践中不断提升;第四,能够独立完成特定任务,而不仅仅是提供建议或答案。

4月8日,DeepSeek上线的专家模式就提到,专家模式具备领域深度增强、多步推理可视化、引用溯源强化、自定义专家组合、长上下文压缩优化等特点。专家模式沿用了 R1的长思维链推理能力,但针对专业领域做了定向蒸馏和微调,使“快思考”与“慢思考”在领域内更平衡。

林建龙也强调了未来“专家 Agent”理念的实现,需要系统化和工程化的方法。他表示,当前华通云正围绕底座模型、数据管理、提示词工程、长期记忆等核心技术要素,构建了一套完整的AI Agent开发框架。

其中底座模型提供基础的认知和推理能力,数据管理完成对企业数据的链接和交互,提示词工程负责将业务需求转化为模型可理解的任务指令,MCP Tools(用于与外部系统进行交互的工具集或协议)提供与外部系统交互的能力,Skills(技能)封装了特定领域的专业技能,长期记忆机制则使Agent能够在多轮交互中积累经验、实现智能的个性化服务。

每日经济新闻

相关内容

工业具身智能机器人的“头号...
随着制造业数字化转型进入深水区,痛点早已不再是简单的机器换人,而是...
2026-04-09 00:25:15
强化Agent能力,为何成...
近期,国产大模型动作频频。 4月2日,阿里发布千问新一代大语言模型...
2026-04-09 00:19:02
算力上天!太空算力为何成为...
通信世界网消息(CWW)相信大家对算力已经是耳熟能详了,“太空算力...
2026-04-08 22:38:43
GPT-6如果只是吊胃口,...
文 | 字母AI 有人说,自从GPT-6被爆4月发布后,Deep...
2026-04-08 20:02:28
视界 | 如何建立国有企业...
来源 / 丽莎闻道 责编 / 沈竹山 校审 / 李 翔 监制 / ...
2026-04-08 17:45:41
椒江不好,为何台州各县市人...
台州“散装”格局下,椒江是唯一能整合全市资源的核心,人口向中心集聚...
2026-04-08 13:52:38

热门资讯

原创 如... 肺是人体非常重要的器官,空气中的很多灰尘和垃圾都会随空气进入肺部,所以肺部的清洁是非常重要的。我们可...
孕妈检测出胎儿没有“胎心”究竟... 原标题:孕妈检测出胎儿没有“胎心”究竟为何?多半是这4种原因,预防下 昨天小樱...
耳聋耳背知识分享-----耳朵... 耳朵听力下降恢复方法首先要找出听力下降的病因,其次针对病因进行对症治疗。 耳朵听力下降,如何恢复听...
激光术后护理指南:如何科学恢复... 二氧化碳激光是一种常用于去除瘢痕、色素沉着、皱纹和其他皮肤问题的治疗方法。它通过发射高能量的二氧化碳...
如何有效应对低血压问题,提升生... 血压低,这个问题在生活中并不罕见。很多人可能会觉得,血压低就像是个小毛病,不用太在意。但实际上,低血...
郑州银行大额存单利率:1、活期... 导读2022郑州银行大额存单利率一、存款利率:1、活期存款:0.3%2、整存整取:三个月1.60%,...
孩子自控力差?家长如何引导培养 孩子自控力差?家长如何引导培养 在孩子的成长过程中,自控力是一项至关重要的能力。它关乎孩子的学业表现...
原创 婴... 在宝宝的成长过程中,奶粉作为重要的营养来源,其选择至关重要。那么,什么样的婴儿奶粉比较好呢?奶粉的营...
原创 高... 《水浒传》中,那些绿林好汉多半是不近女色的,比如晁盖登场时,书中就提到这么一句。 “那东溪村保正,姓...
存款利息怎么算?湖南农商行存款... 导读湖南农商行存款利息怎么算?湖南农商行作为湖南最大的股份制银行,它是一家地方性、集约化、国际化、股...