近日,DeepSeek-V3.1正式发布,新版本引入混合推理架构,可同时支持思考模式与非思考模式,显著提升响应效率与任务处理能力。该模型在Agent任务执行和工具调用等方面也实现了明显进步。

作为DeepSeek-V3.1的重要硬件支持,英特尔Gaudi 2E AI加速器现已为该模型提供深度优化,从训练到推理实现全流程高效支撑。Gaudi 2E以出色的性能与成本效益,为大模型落地提供了新的高性价比选择。
Gaudi 2E配备96GB大容量内存,搭载先进HBM控制器,在线性访问和随机访问等场景中均进行了针对性优化,有效降低AI任务延迟,保障计算流程顺畅稳定。该加速器还具备优秀的可扩展性,支持多卡互联,为用户提供高度灵活的定制化AI解决方案,满足多样化的模型部署需求。
在实际性能测试中,搭载8张英特尔Gaudi 2E的一体机服务器运行DeepSeek-V3.1表现突出:在输入/输出长度均为1K、并发用户数为30的条件下,每个并发生成速度达到10 token/秒;在输入/输出长度为2K、并发用户数为28时,仍可保持10 token/秒的高生成速率。这表明DeepSeek-V3.1在问答和代码生成等任务中具备更稳定、高效的综合能力。
英特尔表示,未来将继续通过开放架构、技术支持和生态合作,推动AI产业创新与发展,加速大模型技术实现广泛落地和普惠应用。
声明:登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。
如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容,本网站对此声明具有最终解释权。









