OpenAI推出语音交互新标杆GPT-realtime 多模态AI助手实现人类级语音表达
时间:2025-09-01 16:22:23 来源:网络

OpenAI近日正式发布新一代语音模型GPT-realtime。作为专注于语音AI智能体的多模态系统,该模型能够生成极具自然感和流畅度的语音输出,精准复现人类语言中的语调起伏、情感层次和语速动态变化,同时具备图像理解能力,支持与语音或文本对话结合使用。

GPT-realtime可广泛应用于客服、教育、金融、医疗等多个行业,帮助构建高完成度的语音交互智能体。据官方介绍,该模型在多项核心能力上表现突出:不仅能高度遵循复杂指令、精准调用外部工具,还可生成更自然且富有表现力的语音。其在重复字母与数字、逐字朗读法律声明、跨语言语句无缝切换等挑战性场景中,展现出卓越的适应性。

值得关注的是,GPT-realtime具备强大的上下文理解能力,可敏锐捕捉笑声等非语言线索,实时动态调整语音语气,实现如“带法国口音的友好声调”或“语速较快的专业表达”等多样化风格切换。

此次更新还引入了“Cedar”和“Marin”两种全新语音风格,并对既有的八种语音模式进行了全面优化,进一步丰富了语音输出的表现层次与适用场景。


声明:登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。

如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容,本网站对此声明具有最终解释权。


关于我们

    欢迎来到 173183 资讯平台 —— 游戏党、数码控和汽车迷的专属信息集结地!

    咱这儿专治各种 “信息荒”:游戏圈的新瓜旧料咱全兜着,新游预告、版本更新、赛事骚操作,保证让你比队友先一步摸到版本密码;数码圈的新鲜货更别错过,小到能塞进兜的耳机,大到能压垮桌的主机,新品解析、性能扒皮,帮你躲开商家的 “彩虹屁”;汽车圈的瓜也管够,新车上市、技术突破、政策变动,不管是喝油的、用电的还是只存在于图纸上的,都给你唠得明明白白。

    咱不整那些云里雾里的词儿,专业干货全给你嚼碎了说。管你是抱着手柄的硬核玩家,揣着拆机组装的数码狂魔,还是对着仪表盘流口水的汽车迷,来了就别走,保准有你的菜!

    违法和不良信息举报:60178@qq.com