173183

DeepSeek-V3.1 正式发布推理效率提升、Agent能力增强

时间：2025-08-22 17:17:41 来源：网络

DeepSeek 团队于今日正式推出 DeepSeek-V3.1，该版本在推理架构、思考效率、Agent 能力等多个方面实现显著升级。新版本采用混合推理架构，允许同一个模型在思考模式（Think Mode）和非思考模式（Non-Think Mode）之间灵活切换，用户可通过官方 App 及网页端的“深度思考”按钮自由选择响应机制。

在推理效率方面，DeepSeek-V3.1-Think 相比前代模型 DeepSeek-R1-0528，能够在更短时间内完成复杂推理并给出答案。同时，通过 Post-Training 阶段的优化，新模型在工具调用和智能体任务中的表现也有明显提升，更好地支持多步任务处理与外部系统协同。

API 服务也同步更新，deepseek-chat 和 deepseek-reasoner 分别对应非思考模式和思考模式，上下文长度统一扩展至 128K。此外，API Beta 接口新增 strict 模式的 Function Calling，确保输出严格遵循预设 schema。为提升兼容性，DeepSeek-V3.1 还新增了对 Anthropic API 格式的支持，便于开发者将其集成至 Claude Code 框架。

在多项专业测评中，DeepSeek-V3.1 表现突出。在代码修复（SWE）和命令行终端任务（Terminal-Bench）测试中，新模型相比此前版本有显著进步。同时，在复杂搜索任务（browsecomp）和多学科专家级问题（HLE）评测中，V3.1 也大幅领先于 R1-0528。

值得注意的是，V3.1-Think 版本通过思维链压缩训练，在输出 token 数量减少 20%–50% 的情况下，仍能保持与 R1-0528 相当的任务性能。非思考模式也实现了更精简的输出，在显著缩短生成长度的同时，维持了原有的模型能力。

这一系列升级使 DeepSeek-V3.1 在效率、可控性和任务完成能力方面均迈上新台阶，为开发者及企业用户提供了更强大、更灵活的人工智能基础模型支持。

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

如涉及作品内容、版权和其它问题，请在30日内与本网联系，我们将在第一时间删除内容,本网站对此声明具有最终解释权。