首页 > AI头条  > 正文

​OpenAI 更新语音助手功能,让对话更自然流畅、减少打断频率

2025-03-25 09:44 · 来源: AIbase基地

OpenAI 于本周一发布了其高级语音模式的更新,该功能允许用户与 ChatGPT 进行实时对话。更新后的语音助手在交流中表现得更加人性化,并且减少了对用户的打断频率。OpenAI 的后期培训研究员 Manuka Stratta 通过一段视频在公司官方社交媒体渠道上公布了这一消息。

QQ_1742867031579.png

此次更新旨在解决 AI 语音助手常见的问题,即在用户思考或深呼吸时频繁打断。现在,所有的 ChatGPT 免费用户都可以体验到新版本的高级语音模式,这一版本允许用户在与 AI 助手对话时进行停顿而不被打断。同时,付费用户,包括 OpenAI 的 Plus、Teams、Edu、Business 和 Pro 等订阅用户,在使用高级语音模式时也会减少打断的频率,语音助手的个性化表现得到了进一步提升。

OpenAI 的一位发言人向 TechCrunch 表示,新的 AI 语音助手对付费用户来说 “更加直接、引人入胜、简明扼要、具体且富有创意”。这种改进不仅提高了用户的使用体验,也体现了 OpenAI 对竞争对手的强烈回应。

在 AI 语音助手领域,OpenAI 面临着来自各方的激烈竞争。例如,初创公司 Sesame,由 Oculus 联合创始人 Brendan Iribe 创办,最近因其自然流畅的 AI 语音助手 Maya 和 Miles 而迅速走红。此外,像亚马逊这样的行业巨头也正在加紧步伐,准备推出其基于大语言模型(LLM)的新版 Alexa。这些竞争推动着 AI 语音助手的不断创新与进步。

通过这次更新,OpenAI 不仅提升了产品的实用性,还在 AI 助手的市场竞争中争取了更多的优势,为用户提供了更加友好的互动体验。

划重点:

🌟 OpenAI 推出高级语音模式更新,使 AI 助手与用户对话更自然,减少打断频率。  

🎤 免费用户现在也能享受无打断的对话体验,付费用户则获得更具个性化的语音助手。  

🚀 OpenAI 在激烈的市场竞争中不断改进,力求在 AI 语音助手领域保持领先地位。

  • 相关推荐
  • AI日报:海螺AI首尾帧功能上线;元石科技发布问小白5;OpenAI发布全新语音模型GPT-Realtime

    AI日报栏目每日提供人工智能领域热点内容,聚焦开发者,帮助洞悉技术趋势、了解创新AI产品应用。最新动态包括:MiniMax海螺AI首尾帧功能上线;元石科技发布问小白5挑战GPT-5;OpenAI推出语音模型GPT-Realtime;谷歌Gemini AI优化表格处理;腾讯黑科技实现AI配音;百度计划培养千万AI人才;MathGPT.ai反作弊功能推广;苹果Xcode集成Claude Sonnet4;微软发布自研AI模型MAI系列;xAI推出高效编码模型Grok Code Fast1;SuperCLUE多模态评测Gemini-2.5-Pro居首;9月1日起AI内容标识新规实施,违规将承担法律风险。

  • 元宝再次上新!一句话就能P人像,出图更快更自然了

    9月4日,腾讯元宝升级AI图片编辑功能,支持一句话指令实现一键美颜、肤色调整、智能美妆等操作,覆盖手机、电脑及网页端。该功能免费开放,可智能完成磨皮、美白、放大双眼等编辑,并支持全身肤色调整和定制化修图,满足个性化高效出图需求。腾讯表示将持续迭代,打造“好用的AI”。

  • vivo X300首发OriginOS 6 韩伯啸:流畅度升级最明显

    vivo产品经理韩伯啸介绍,vivo X300系列出厂搭载全新的OriginOS 6系统,目前OriginOS 6 Beta版本已经推送给X200系列。 韩伯啸介绍,OriginOS 6的体验提升真不少,通知堆叠、音量条设计这次都改到位了,还有大家高度关注的全局直驱供电也上了,打游戏、刷短视频等高频场景全都支持,基本上全场景都适配了直驱供电。他还表示,从我在X300上的体验感知来看,流畅度和设计感可能是这�

  • 明天首批推送!小米澎湃OS 3一图看懂:底层提升流畅度、超级岛更好用

    小米今天正式发布了澎湃OS 3,这次并没有带来太多的全新功能,主要专攻基础体验和流畅度。 在基础体验方面,小米澎湃OS 3着重对底层进行深度打磨,通过热点编译加速、窗口绘制下沉等技术手段,实现了多项关键性能指标的优化。 在系统运行负载上,CPU负载降低了4%,同时CPU能效提升10%,使得手机在处理多任务以及复杂运算时更加高效,功耗更低。 窗口动画丢帧率降低1

  • 小红书语音评论更新:可识别音色了 支持甜嗓、气泡音、元气音等

    近日,小红书平台上的语音评论功能引发网友热议。据媒体报道及多名网友在社交平台分享,小红书不仅推出了语音评论,还进一步升级,新增了音色识别功能,用户现在可以选择甜嗓、气泡音、元气音等多种音色进行评论。 回溯至7月下旬,小红书的部分用户便惊喜地发现,评论区悄然出现了语音评论的选项。当时,小红书官方明确表示,该功能尚处于内测阶段,并未全量�

  • OpenAI发布语音模型GPT-realtim:具备情感感知能力 多语言无缝切换

    OpenAI正式发布语音模型GPT-realtime。 据介绍,GPT-realtime是一款专注于语音AI Agent的多模态模型,能够生成高度自然流畅的语音,精准还原人类语调、情感和语速的丰富变化。该模型支持图像理解,并可结合语音或文本对话使用,非常适合应用于客服、教育、金融、医疗等领域,用于构建高质量的语音智能体。 官方表示,新模型在复杂指令遵循、工具精确调用以及生成更自然、�

  • 王腾更新脉脉 小米工作经历配流汗表情

    近日,小米集团发布内部公告,宣布中国区市场部员工王腾因泄露公司机密信息并存在利益冲突等严重违规违纪行为,依据《小米集团员工违规违纪行为处理办法》及《小米集团诚信廉洁守则》等制度,对其作出辞退处理。该消息迅速引发外界广泛关注,相关话题接连登上社交媒体热搜榜。 据公告披露,王腾的违规行为涉及公司核心信息保护及商业道德准则,小米方面强调将

  • AI日报:抖音打击AI技术滥用行为;OpenAI 收购开发数据分析平台 Statsig;ElevenLabs 音效模型更新

    抖音打击AI技术滥用行为,对违规商家和达人采取下架、清退等措施。ElevenLabs音效模型升级至版本2,支持长音频和无缝循环。OpenAI收购数据分析平台Statsig,增强产品迭代能力。亚马逊推出Lens Live AI功能,实时扫描购物。谷歌AI推出Stax工具,帮助开发者评估大语言模型。WordPress推出AI工具Telex简化网站构建。Liquid AI发布LFM2-VL模型,提升手机视觉语言处理。苹果开源FastVLM与MobileCLIP2模型,优化边缘设备AI应用。MetaGPT推出自动化测试工具RealDevWorld,精准率达92%。瑞士发布开源大模型Apertus,提供多语言处理能力。

  • AI日报:苹果明年推出SiriAI搜索;OpenAI放开ChatGPT Projects功能;Kimi K2-0905 上线 Discord

    本文汇总了AI领域最新动态:苹果与谷歌合作,计划在Siri中引入Gemini AI技术;OpenAI向免费用户开放Projects功能,提升任务管理效率;谷歌推出免费Gemini CLI工具,集成GitHub提升开发效率;OpenAI估值飙升至5000亿美元,二级股票售出103亿美元;苹果自研AI搜索引擎“世界知识问答”计划2026年上线;月之暗面发布Kimi K2-0905模型,提升编程与创意写作能力;Raycast推出Cursor Agent插件优化代码编辑;谷歌发布nano banana官方Prompt模板,助力创意设计。

  • 小米16首发!曝澎湃OS 3流畅度提升 人像模式升级

    今日,数码博主智慧皮卡丘”爆料称,小米澎湃OS 3将进一步提升系统流畅度以及设备互联稳定性。 同时,澎湃OS 3将支持系统级AI,并对系统UI进行重构,后续版本还将适应阔屏的迭代。

今日大家都在搜的词: