近日,DeepSeek-V3.1正式发布,新版本引入混合推理架构,可同时支持思考模式与非思考模式,显著提升响应效率与任务处理能力。该模型在Agent任务执行和工具调用等方面也实现了明显进步。
作为DeepSeek-V3.1的重要硬件支持,英特尔Gaudi 2E AI加速器现已为该模型提供深度优化,从训练到推理实现全流程高效支撑。Gaudi 2E以出色的性能与成本效益,为大模型落地提供了新的高性价比选择。
Gaudi 2E配备96GB大容量内存,搭载先进HBM控制器,在线性访问和随机访问等场景中均进行了针对性优化,有效降低AI任务延迟,保障计算流程顺畅稳定。该加速器还具备优秀的可扩展性,支持多卡互联,为用户提供高度灵活的定制化AI解决方案,满足多样化的模型部署需求。
在实际性能测试中,搭载8张英特尔Gaudi 2E的一体机服务器运行DeepSeek-V3.1表现突出:在输入/输出长度均为1K、并发用户数为30的条件下,每个并发生成速度达到10 token/秒;在输入/输出长度为2K、并发用户数为28时,仍可保持10 token/秒的高生成速率。这表明DeepSeek-V3.1在问答和代码生成等任务中具备更稳定、高效的综合能力。
英特尔表示,未来将继续通过开放架构、技术支持和生态合作,推动AI产业创新与发展,加速大模型技术实现广泛落地和普惠应用。
声明:登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。
如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容,本网站对此声明具有最终解释权。
- 微信鸿蒙版1.0.10.36正式版更新发布:新增锁屏界面接听语音通话等8大功能
- 《安家》《三十而已》取景老洋房二次拍卖折戟,9666 万起拍价无人出价
- 桂圆琼玉颗粒:解决头发早白的中医调理新选择
- 定档 10 月 10 日!《创:战纪》续作《创:战神》发布新预告,看点十足
- 高通与虚幻引擎成立开发者联盟 携手助力中国移动游戏生态创新
- 出海正当时:聚焦非一线城市出海新机遇,以技术赋能企业出海加速
- “奥运级”科技实力获全球认证!TCL实业荣获三项IFA 2025大奖
- 特斯拉官方AI账号上线 首发Optimus三代人形机器人细节
- 胖东来发布打假声明:举报假冒自有品牌商品有奖励
- 索尼PlayStation 5 Pro将于2026年第一季度支持AMD FSR 4超分辨率技术