GPT-4o 语音模式全新升级：唱歌功能上线，AI交互进入新境界

2025-05-27 11:27 · 来源： AIbase基地

OpenAI 旗下 GPT-4o 的高级语音模式（Advanced Voice Mode）近期迎来重大更新，不仅能进行更自然的语音交互，还新增了令人瞩目的“唱歌”功能。尽管当前唱歌表现尚显稚嫩，但这一突破无疑为 AI 的多模态交互能力开辟了新可能。AIbase 综合整理最新信息，为您解析 GPT-4o 语音模式的最新进展及其潜力。

唱歌功能上线:AI也能“开嗓”

最新消息显示，GPT-4o 的高级语音模式现已支持唱歌功能，用户可以通过语音指令要求 AI 演唱歌曲，甚至包括一些受版权保护的曲目。这一功能让 GPT-4o 能够根据用户需求生成旋律、歌词或模仿特定风格的演唱，为交互体验增添趣味性。尽管目前“唱功”仍需优化，AIbase 观察到，这一功能的加入标志着 GPT-4o 在音频生成领域的全新尝试。

多模态交互再升级:更自然、更情感

GPT-4o 的高级语音模式以其端到端语音处理能力著称，相较于传统语音模式（依赖语音转文本再生成语音），新模式直接处理音频输入，显著降低了响应延迟，平均仅为320毫秒。此外，GPT-4o 能够捕捉用户的语速、语气等非语言线索，并以更富情感的语音回应，甚至支持用户随时打断对话，带来接近人类对话的自然体验。

功能亮点:笑声、哭声全能驾驭

除了唱歌，GPT-4o 高级语音模式还能根据指令生成笑声、哭声等情感表达，进一步丰富了交互场景。例如，用户可以要求 AI 以戏剧化、幽默或特定角色的语气进行回应，如模仿动画角色或名人语音。这种灵活性使其在娱乐、教育和创意内容生成领域展现出巨大潜力。

当前局限:唱歌仍需打磨

尽管新增了唱歌功能，但 GPT-4o 的演唱表现尚未达到专业水准。测试中，AI 在处理复杂旋律或高音时可能显得不够流畅，且部分用户反馈其语音质量相较于其他 AI 语音模型（如 Pi AI 或 Siri）略显逊色，采样率较低导致音质略有压缩感。OpenAI 表示，唱歌功能的加入旨在探索音频生成边界，未来将通过持续优化提升表现。

安全与版权考量:有限制的创新

为尊重版权，OpenAI 对 GPT-4o 的语音输出设置了严格的过滤机制，限制其生成受版权保护的音乐内容。然而，近期信息显示，部分用户已成功让 AI 演唱受版权保护的歌曲，引发了关于版权界限的讨论。此外，GPT-4o 在某些音频任务（如自动歌唱评分或语音合成）上存在较高拒绝率，可能是出于避免生成未经授权内容或缺乏客观标准的考量。

语音 AI 的新篇章

GPT-4o 高级语音模式的更新，尤其是唱歌功能的加入，标志着 OpenAI 在多模态 AI 领域的持续突破。尽管当前唱歌表现有待提升，但其低延迟、自然交互和情感表达能力已显著领先于传统语音助手，如 Siri 和 Alexa。AIbase 认为，随着 OpenAI 进一步优化音质和版权处理机制，GPT-4o 有望在教育、娱乐和客户服务等领域掀起新的应用热潮。

结语

GPT-4o 高级语音模式的唱歌功能为 AI 交互注入了更多趣味与可能性，尽管仍需技术打磨，其创新意义不容忽视。从低延迟对话到情感化表达，GPT-4o 正在重新定义人机交互的边界。

相关推荐

荐AI日报：海螺AI首尾帧功能上线；元石科技发布问小白5；OpenAI发布全新语音模型GPT-Realtime

AI日报栏目每日提供人工智能领域热点内容，聚焦开发者，帮助洞悉技术趋势、了解创新AI产品应用。最新动态包括：MiniMax海螺AI首尾帧功能上线；元石科技发布问小白5挑战GPT-5；OpenAI推出语音模型GPT-Realtime；谷歌Gemini AI优化表格处理；腾讯黑科技实现AI配音；百度计划培养千万AI人才；MathGPT.ai反作弊功能推广；苹果Xcode集成Claude Sonnet4；微软发布自研AI模型MAI系列；xAI推出高效编码模型Grok Code Fast1；SuperCLUE多模态评测Gemini-2.5-Pro居首；9月1日起AI内容标识新规实施，违规将承担法律风险。

AI 人工智能技术趋势
客流易AI功能上线！一键生成开店选址和客流统计分析报告！

客易APP推出AI选址功能，基于海量时空数据与智能算法，为创业者提供精准开店位置评估。该功能通过深度分析客流量、消费能力、周边业态等多维度数据，生成详细选址报告，帮助用户从经验决策升级为智能决策，提升开店成功率与商业价值。

AI选址开店选址商业地理
百度地图官宣深度适配小米澎湃OS 3：四大神级功能上线

小米澎湃OS 3近日已经开启首批Beta，这次不仅是发布直接面向用户开放测试，连开发者适配也大大提速。今天百度地图官方宣布已深度适配澎湃OS 3，带来了通勤党必须拥有的4个神级功能：小米超级岛早晚高峰路口等红灯，显示实时红灯读秒，精准预判通行时间，通勤效率拉满。

小米澎湃OS 3 百度地图适配
百度商家智能体全新升级，以技术革新赋能商家转化经营新突破

百度9月宣布旗下百度商家智能体全面升级，旨在为商家提供智能化获客服务。升级后产品通过“一脑多专”架构提升响应速度62%，成本降低60%，并优化语音交互、数据分析等功能，助力商家精准营销、降本增效。该智能体覆盖30多个行业场景，支持多角色运营，有效提升转化率，推动数字化转型。

百度商家智能体智能化获客数字经济
轻巧新境界，智慧随心至——华为MatePad Mini 8.8英寸正式发布

华为于2025年9月4日发布全新HUAWEI MatePad Mini平板，主打8.8英寸轻薄设计，仅重255g、厚5.1mm。搭载鸿蒙5.1系统，支持插卡通话和蜂窝网络，配备柔性OLED全面屏，峰值亮度达1800nits。内置6400mAh电池，支持66W快充。提供办公、阅读、创作等多场景体验，售价3999元起，9月12日正式开售。

华为MatePad Mini 小尺寸平板
ChatGPT语音模式增添新功能：可调语速支持0.5到2.0倍速

OpenAI为其ChatGPT网页应用的语音模式推出新功能，加入语音速度”调节与自定义指令前缀”，同时配合此前升级的模型选择器，进一步提升用户体验。新增的语音速度”选项让用户可通过滑块自由调整ChatGPT的语速，范围从0.5倍速到2.0倍速，不过该功能目前仍处于隐藏状态，尚未正式开放。自定义指令前缀”功能则允许语音模式记住用户的特定要求，避免重复输入。系统明确�

ChatGPT 语音模式自定义指令
抖音升级AI内容标识功能上线两项核心功能

9月1日，抖音发布《抖音关于升级AI内容标识功能的公告》，旨在规范人工智能生成合成内容（AI内容）的标识，以维护用户和创作者的合法权益，并促进AIGC技术的健康发展。抖音于2023年首次发布相关规范和倡议，倡导创作者对AI内容进行显著标识。此次升级是根据国家相关法律法规及平台规则进行的，以更好地服务于社会。抖音上线了两项核心功能:AI内容标识功能和AI内容元

AI内容标识抖音公告 AIGC技术
永恒之声，现代演绎 Technics 推出全新直驱式唱盘机SL40C/40CBT

Technics推出全新SL-40C/40CBT直驱唱盘系统，融合高端机械技术与现代设计。该产品延续品牌经典特性，如无芯直驱电机和高精度S形铝合金唱臂，同时升级外观与易用性。配备预装唱头、内置唱头放大器，支持蓝牙连接（仅40CBT型号），提供三种现代配色。旨在满足HiFi用户和现代家庭音频爱好者的需求，兼顾音质与便捷体验。

高端机械技术现代风格便捷性
OpenAI发布语音模型GPT-realtim：具备情感感知能力多语言无缝切换

OpenAI正式发布语音模型GPT-realtime。据介绍，GPT-realtime是一款专注于语音AI Agent的多模态模型，能够生成高度自然流畅的语音，精准还原人类语调、情感和语速的丰富变化。该模型支持图像理解，并可结合语音或文本对话使用，非常适合应用于客服、教育、金融、医疗等领域，用于构建高质量的语音智能体。官方表示，新模型在复杂指令遵循、工具精确调用以及生成更自然、�

语音模型 GPT-realtime 多模态模型
美团将上线AI搜索功能：基于用户行为与需求进行智能匹配

美团正测试AI本地生活搜索功能，已进入内测阶段。该功能基于用户行为智能匹配服务，优化搜索体验。同时，美团发布并开源LongCat-Flash-Chat模型，采用MoE架构，总参数量560B，激活参数18.6B~31.3B，实现计算效率与性能双重优化。该模型在多项基准测试中表现优异，尤其在智能体任务中具备突出优势。

AI搜索本地生活服务美团App

今日大家都在搜的词：

热文

3 天
7天

GPT-4o 语音模式全新升级：唱歌功能上线，AI交互进入新境界

荐AI日报：海螺AI首尾帧功能上线；元石科技发布问小白5；OpenAI发布全新语音模型GPT-Realtime

客流易AI功能上线！一键生成开店选址和客流统计分析报告！

百度地图官宣深度适配小米澎湃OS 3：四大神级功能上线

百度商家智能体全新升级，以技术革新赋能商家转化经营新突破

轻巧新境界，智慧随心至——华为MatePad Mini 8.8英寸正式发布

ChatGPT语音模式增添新功能：可调语速支持0.5到2.0倍速

抖音升级AI内容标识功能上线两项核心功能

永恒之声，现代演绎 Technics 推出全新直驱式唱盘机SL40C/40CBT

OpenAI发布语音模型GPT-realtim：具备情感感知能力多语言无缝切换

美团将上线AI搜索功能：基于用户行为与需求进行智能匹配

今日大家都在搜的词：

热文

小米澎湃OS 3首批Beta版更新“3.0.0.24”发布

华为发布首款MateTV：超薄设计搭载旗舰性能 8999元起预售

三大运营商回应是否支持eSIM版iPhone：需等待通知

OPPO A6 Pro定档 9 月 9 日发布：开启手机六年耐用新时代

AI日报：苹果明年推出SiriAI搜索；OpenAI放开ChatGPT Projects

AI日报：拍我AI接入Nano Banana；腾讯智影暂停服务；京东自研京

全新问界M7开售1小时订单破10万售价28.8万元起

尊界S800选配星空顶涨价3万：价格上调至 8 万元

苹果折叠屏iPhone或将采用真全面屏形态：告别刘海与挖孔

华为FreeBuds 7i无线耳机开售：首发价499元

雷军凌晨3点就奔赴阅兵观礼台佩戴小米AI眼镜前往

小米澎湃OS 3首批Beta版更新“3.0.0.24”发布

AI日报：腾讯开源3D世界模型HunyuanWorld-Voyager；即梦AI系列

华为发布首款MateTV：超薄设计搭载旗舰性能 8999元起预售

三大运营商回应是否支持eSIM版iPhone：需等待通知

华为MatePad Mini外观公布支持蜂窝网络通话功能

AI日报：AI内容新规正式生效；美团推出开源大模型LongCat；阶跃

人去世了朋友圈会消失？微信客服回应：建议保持账号活跃

OPPO A6 Pro定档 9 月 9 日发布：开启手机六年耐用新时代

腾讯回应被米哈游起诉：没正式程序不能违规提供QQ用户资料

站长商机