ChatGPT语音功能升级,支持双向实时对话

2026年06月24日 16:53
本文共计673个字,预计阅读时长3分钟。
来源/aibase 责编/LaosijiAming 老司机阿明

人工智能的语音交互正在迎来一场“降维打击”式的进化。近日,不少用户在 ChatGPT 的网页端及 App 端发现了一个名为“Bidi1”的新型语音模型,预示着 OpenAI 正筹备开启更大规模的测试,为 AI 语音交互带来前所未有的流畅体验。

长期以来,AI 语音助手往往遵循着“我问、你答”的线性逻辑,用户必须等待 AI 将上一段话完整输出后,才能进行下一次互动。而 Bidi1语音模型的出现,彻底打破了这一桎梏。其核心亮点在于“双向并行处理”:AI 不仅能在说话的同时实时监听用户的输入,还能在对话进行到一半时,立即响应用户的打断或新指令。

image.png

这种交互模式极大地拉近了人机对话与真实人类沟通的距离。在演示案例中,当模型正在执行“从1数到10”的任务时,用户随时插话要求其“倒数”,模型能够无缝衔接并立刻切换逻辑执行新指令。这种“边听边回、实时响应”的交互逻辑,彻底告别了僵硬的等待周期,让对话变得极其自然、丝滑。

在界面操作层面,Bidi1的辨识度也相当高。当用户在设置的模型选择器中选中该选项后,原有的语音气泡将转变为醒目的黄色,以提示用户当前已切换至这一高级语音模式。

虽然 OpenAI 官方尚未对此进行大范围的正式发布,但根据目前的测试反馈来看,这一功能的上线已经进入倒计时。从辅助工具到真正的对话伙伴,ChatGPT 的这一轮升级,不仅提升了语音交互的效率,更在人机协作的沉浸感上迈出了重要的一步。对于习惯通过语音处理事务的用户而言,一个更懂“听话”且反应迅捷的智能助手即将触手可及。

来源:告别“你问我答”:ChatGPT 语音功能重磅升级,双向实时对话时代开启 | AIbase

声明:本文来自aibase,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/