DeepSeek-V3.1 正式发布 推理效率提升、Agent能力增强
时间:2025-08-22 17:17:41 来源:网络

DeepSeek 团队于今日正式推出 DeepSeek-V3.1,该版本在推理架构、思考效率、Agent 能力等多个方面实现显著升级。新版本采用混合推理架构,允许同一个模型在思考模式(Think Mode)和非思考模式(Non-Think Mode)之间灵活切换,用户可通过官方 App 及网页端的“深度思考”按钮自由选择响应机制。

在推理效率方面,DeepSeek-V3.1-Think 相比前代模型 DeepSeek-R1-0528,能够在更短时间内完成复杂推理并给出答案。同时,通过 Post-Training 阶段的优化,新模型在工具调用和智能体任务中的表现也有明显提升,更好地支持多步任务处理与外部系统协同。

API 服务也同步更新,deepseek-chat 和 deepseek-reasoner 分别对应非思考模式和思考模式,上下文长度统一扩展至 128K。此外,API Beta 接口新增 strict 模式的 Function Calling,确保输出严格遵循预设 schema。为提升兼容性,DeepSeek-V3.1 还新增了对 Anthropic API 格式的支持,便于开发者将其集成至 Claude Code 框架。

在多项专业测评中,DeepSeek-V3.1 表现突出。在代码修复(SWE)和命令行终端任务(Terminal-Bench)测试中,新模型相比此前版本有显著进步。同时,在复杂搜索任务(browsecomp)和多学科专家级问题(HLE)评测中,V3.1 也大幅领先于 R1-0528。

值得注意的是,V3.1-Think 版本通过思维链压缩训练,在输出 token 数量减少 20%–50% 的情况下,仍能保持与 R1-0528 相当的任务性能。非思考模式也实现了更精简的输出,在显著缩短生成长度的同时,维持了原有的模型能力。

这一系列升级使 DeepSeek-V3.1 在效率、可控性和任务完成能力方面均迈上新台阶,为开发者及企业用户提供了更强大、更灵活的人工智能基础模型支持。


声明:登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。

如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容,本网站对此声明具有最终解释权。


关于我们

    欢迎来到 173183 资讯平台 —— 游戏党、数码控和汽车迷的专属信息集结地!

    咱这儿专治各种 “信息荒”:游戏圈的新瓜旧料咱全兜着,新游预告、版本更新、赛事骚操作,保证让你比队友先一步摸到版本密码;数码圈的新鲜货更别错过,小到能塞进兜的耳机,大到能压垮桌的主机,新品解析、性能扒皮,帮你躲开商家的 “彩虹屁”;汽车圈的瓜也管够,新车上市、技术突破、政策变动,不管是喝油的、用电的还是只存在于图纸上的,都给你唠得明明白白。

    咱不整那些云里雾里的词儿,专业干货全给你嚼碎了说。管你是抱着手柄的硬核玩家,揣着拆机组装的数码狂魔,还是对着仪表盘流口水的汽车迷,来了就别走,保准有你的菜!

    违法和不良信息举报:60178@qq.com