DeepSeek 团队于今日正式推出 DeepSeek-V3.1,该版本在推理架构、思考效率、Agent 能力等多个方面实现显著升级。新版本采用混合推理架构,允许同一个模型在思考模式(Think Mode)和非思考模式(Non-Think Mode)之间灵活切换,用户可通过官方 App 及网页端的“深度思考”按钮自由选择响应机制。

在推理效率方面,DeepSeek-V3.1-Think 相比前代模型 DeepSeek-R1-0528,能够在更短时间内完成复杂推理并给出答案。同时,通过 Post-Training 阶段的优化,新模型在工具调用和智能体任务中的表现也有明显提升,更好地支持多步任务处理与外部系统协同。
API 服务也同步更新,deepseek-chat 和 deepseek-reasoner 分别对应非思考模式和思考模式,上下文长度统一扩展至 128K。此外,API Beta 接口新增 strict 模式的 Function Calling,确保输出严格遵循预设 schema。为提升兼容性,DeepSeek-V3.1 还新增了对 Anthropic API 格式的支持,便于开发者将其集成至 Claude Code 框架。

在多项专业测评中,DeepSeek-V3.1 表现突出。在代码修复(SWE)和命令行终端任务(Terminal-Bench)测试中,新模型相比此前版本有显著进步。同时,在复杂搜索任务(browsecomp)和多学科专家级问题(HLE)评测中,V3.1 也大幅领先于 R1-0528。

值得注意的是,V3.1-Think 版本通过思维链压缩训练,在输出 token 数量减少 20%–50% 的情况下,仍能保持与 R1-0528 相当的任务性能。非思考模式也实现了更精简的输出,在显著缩短生成长度的同时,维持了原有的模型能力。

这一系列升级使 DeepSeek-V3.1 在效率、可控性和任务完成能力方面均迈上新台阶,为开发者及企业用户提供了更强大、更灵活的人工智能基础模型支持。
声明:登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。
如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容,本网站对此声明具有最终解释权。
- 外卖平台试点取消超时罚款:骑手吐槽“不如扣钱”
- 英伟达勾勒AI未来蓝图:Vera Rubin芯片、量子计算与AI工厂引领变革
- iOS 26.1 RC版推送:新增液态玻璃特效开关,锁屏滑动相机支持关闭
- 欧盟统一充电口再扩围:2028年起路由器、游戏机等全面采用USB-C
- 国内首个高功率融合无线快充标准发布,终结协议碎片化乱象
- 西藏游客酒店遇“藏猕猴”入室:国家二级保护动物
- 黑五杀出广州女装大卖,TikTok上爆款率30%!
- 鸿蒙操作系统6正式发布:小艺全面进化 开启全场景智能生活新体验
- 外网顶级主播xQc晒Twitch单日收入:"普通日"入账33万
- “困牛”“累牛”饮料引热议:资质齐全但将继续核实









