阿里开源首个深度研究Agent模型“通义DeepResearch” 登顶多项权威评测榜首
时间:2025-09-17 16:42:43 来源:网络

阿里巴巴近日正式开源其深度研究智能体模型——通义DeepResearch,该模型在多个国际权威评测中取得SOTA(State-of-the-art)成绩,性能超越OpenAI Deep Research、DeepSeek-V3.1及Claude-4-Sonnet等基于旗舰大模型的智能体,成为当前开源社区中表现最优的Agent模型之一。

通义DeepResearch在Humanity's Last Exam(HLE)、BrowseComp-zh、GAIA、xbench-deepsearch、WebWalkerQA及Frames等评测中均表现突出,尤其以仅3B激活参数量实现强劲性能,显示出优异的效率与泛化能力。

传统深度研究方法通常采用“单窗口、线性累加”的信息处理机制,在长周期、高复杂性任务中容易遭遇“认知空间窒息”与噪声污染问题,导致推理性能显著下降。为应对这一挑战,通义团队构建了完整的合成数据驱动训练链路:以Qwen3-30B-A3B为基座模型,结合真实与虚拟环境中的强化学习验证模块,并引入高效异步强化学习算法与自动化数据策展流程,大幅提升模型迭代速度和泛化性能。

在推理机制上,团队提出两种运行模式:ReAct模式用于检验模型基础能力,而自研的IterResearch-Heavy模式则通过test-time scaling策略充分释放模型潜能,确保即使在长程复杂任务中仍可保持高质量推理。

目前,通义DeepResearch的模型权重、训练框架及实现方案已在GitHub、Hugging Face和魔搭社区全面开放,供研究者和开发者自由下载与使用。

今年以来,阿里已陆续开源包括WebWalker、WebDancer与WebSailor在内的多款智能体模型,均在开源社区中获得积极反响并取得SOTA成绩,持续推动Agent技术领域的开放创新与实用化进展。


声明:登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。

如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容,本网站对此声明具有最终解释权。


关于我们

    欢迎来到 173183 资讯平台 —— 游戏党、数码控和汽车迷的专属信息集结地!

    咱这儿专治各种 “信息荒”:游戏圈的新瓜旧料咱全兜着,新游预告、版本更新、赛事骚操作,保证让你比队友先一步摸到版本密码;数码圈的新鲜货更别错过,小到能塞进兜的耳机,大到能压垮桌的主机,新品解析、性能扒皮,帮你躲开商家的 “彩虹屁”;汽车圈的瓜也管够,新车上市、技术突破、政策变动,不管是喝油的、用电的还是只存在于图纸上的,都给你唠得明明白白。

    咱不整那些云里雾里的词儿,专业干货全给你嚼碎了说。管你是抱着手柄的硬核玩家,揣着拆机组装的数码狂魔,还是对着仪表盘流口水的汽车迷,来了就别走,保准有你的菜!

    违法和不良信息举报:60178@qq.com