DeepSeek 团队于今日正式推出 DeepSeek-V3.1,该版本在推理架构、思考效率、Agent 能力等多个方面实现显著升级。新版本采用混合推理架构,允许同一个模型在思考模式(Think Mode)和非思考模式(Non-Think Mode)之间灵活切换,用户可通过官方 App 及网页端的“深度思考”按钮自由选择响应机制。
在推理效率方面,DeepSeek-V3.1-Think 相比前代模型 DeepSeek-R1-0528,能够在更短时间内完成复杂推理并给出答案。同时,通过 Post-Training 阶段的优化,新模型在工具调用和智能体任务中的表现也有明显提升,更好地支持多步任务处理与外部系统协同。
API 服务也同步更新,deepseek-chat 和 deepseek-reasoner 分别对应非思考模式和思考模式,上下文长度统一扩展至 128K。此外,API Beta 接口新增 strict 模式的 Function Calling,确保输出严格遵循预设 schema。为提升兼容性,DeepSeek-V3.1 还新增了对 Anthropic API 格式的支持,便于开发者将其集成至 Claude Code 框架。
在多项专业测评中,DeepSeek-V3.1 表现突出。在代码修复(SWE)和命令行终端任务(Terminal-Bench)测试中,新模型相比此前版本有显著进步。同时,在复杂搜索任务(browsecomp)和多学科专家级问题(HLE)评测中,V3.1 也大幅领先于 R1-0528。
值得注意的是,V3.1-Think 版本通过思维链压缩训练,在输出 token 数量减少 20%–50% 的情况下,仍能保持与 R1-0528 相当的任务性能。非思考模式也实现了更精简的输出,在显著缩短生成长度的同时,维持了原有的模型能力。
这一系列升级使 DeepSeek-V3.1 在效率、可控性和任务完成能力方面均迈上新台阶,为开发者及企业用户提供了更强大、更灵活的人工智能基础模型支持。
声明:登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。
如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容,本网站对此声明具有最终解释权。
- 索尼PlayStation 5 Pro将于2026年第一季度支持AMD FSR 4超分辨率技术
- 双层OLED成旗舰设备新标杆:显示效果全面突破,普及仍面临成本挑战
- 迅雷游戏加速器率先上线《无主之地4》“小地图导航”功能
- 虎牙琅琊杯x村运会圆满落幕 电竞星火点燃沂蒙乡村振兴新引擎
- 上海“最严禁塑令”正式落地:重点打击伪环保餐具
- 《生化危机》新导演没看过系列电影,却靠千小时游戏经验执导新作
- 2025年度优秀游戏评选大赛(金翎奖)报名正式启动!
- 掌慧科技旗下行业公益性直播“出海聚能学院”推出五大与广告主息息相关的福利
- 出海正当时:聚焦非一线城市出海新机遇,以技术赋能企业出海加速
- 微星发布DATAMAG 40Gbps磁吸便携SSD 专为创作者打造高速移动存储解决方案