首页 > 业界 > 关键词  > 正文

ChatGPT开口说话了:五种不同语音 语气更像真人

2023-09-26 10:30 · 稿源: 快科技

快科技9月26日消息,OpenAI宣布给聊天机器人ChatGPT增加了语音交谈的功能。这将给谷歌、苹果等巨头在智能语音助手领域带来冲击。

据悉,ChatGPT可以用五个角色”来回答用户的查询,与Alexa和Siri等语音助手相比,它的语气听起来也更像真人。OpenAI表示,增加语音功能是吸引更多用户使用ChatGPT并与其互动的重要方式。

现在,用户不仅可以通过在文本框中输入句子,还可以通过大声说话来提示聊天机器人。

语音助手早已经出现在汽车、智能手机、电视和智能音箱中,每天有无数人使用。但在大多数情况下,语音助手只能进行简单的互动,比如开灯或报天气等。聊天机器人背后的大语言模型”技术开启了一种可能性,让语音助手能够进行更长、更自然的对话,并回答更复杂的问题。

此外,OpenAI还为ChatGPT装上眼睛”,付费用户和企业用户将可以使用图片功能,图片搜索有点像谷歌 Lens,只需拍下感兴趣的照片,ChatGPT 就会找出问题所在,并做出相应的回应。

OpenAI工作人员表示,他们已经测试了语音和图像功能,并增加了安全措施,以确保机器人对敏感话题作出适当的回应。

举报

  • 相关推荐
  • AI日报:苹果明年推出SiriAI搜索;OpenAI放开ChatGPT Projects功能;Kimi K2-0905 上线 Discord

    本文汇总了AI领域最新动态:苹果与谷歌合作,计划在Siri中引入Gemini AI技术;OpenAI向免费用户开放Projects功能,提升任务管理效率;谷歌推出免费Gemini CLI工具,集成GitHub提升开发效率;OpenAI估值飙升至5000亿美元,二级股票售出103亿美元;苹果自研AI搜索引擎“世界知识问答”计划2026年上线;月之暗面发布Kimi K2-0905模型,提升编程与创意写作能力;Raycast推出Cursor Agent插件优化代码编辑;谷歌发布nano banana官方Prompt模板,助力创意设计。

  • ChatGPT语音模式增添新功能:可调语速 支持0.5到2.0倍速

    OpenAI为其ChatGPT网页应用的语音模式推出新功能,加入语音速度”调节与自定义指令前缀”,同时配合此前升级的模型选择器,进一步提升用户体验。 新增的语音速度”选项让用户可通过滑块自由调整ChatGPT的语速,范围从0.5倍速到2.0倍速,不过该功能目前仍处于隐藏状态,尚未正式开放。 自定义指令前缀”功能则允许语音模式记住用户的特定要求,避免重复输入。系统明确�

  • 哪里找最新AI工具官网?如何快速对比ChatGPT替代品?AI工具导航指南 - AIbase

    文章探讨了在AI工具爆炸式增长的时代,用户面临的信息过载和筛选困难问题。主要内容包括:1)AI领域迭代速度远超传统软件,个人追踪信息效率低下且容易错过关键更新;2)AIbase.cn平台致力于解决这一问题,通过聚合主流AI工具、严格审核信息来源、持续更新行业动态;3)平台提供多维对比功能,结构化呈现工具参数,帮助用户快速定位适合需求的解决方案;4)建议用户定期浏览平台资讯栏目,善用搜索筛选功能,通过对比视图做出明智选择。核心价值在于降低信息筛选成本,让用户更高效地获取有价值的AI工具和前沿资讯。

  • 永恒之声,现代演绎 Technics 推出全新直驱式唱盘机SL40C/40CBT

    Technics推出全新SL-40C/40CBT直驱唱盘系统,融合高端机械技术与现代设计。该产品延续品牌经典特性,如无芯直驱电机和高精度S形铝合金唱臂,同时升级外观与易用性。配备预装唱头、内置唱头放大器,支持蓝牙连接(仅40CBT型号),提供三种现代配色。旨在满足HiFi用户和现代家庭音频爱好者的需求,兼顾音质与便捷体验。

  • 当黑胶豆染上午夜蓝:Technics 60周年的深邃献礼,四色如律至臻原音

    2025年9月,Technics推出旗舰无线蓝牙耳机EAH-AZ100新配色“午夜蓝”,可选颜色增至四种。该耳机凭借卓越音质、智能操控和舒适佩戴体验广受赞誉,采用磁流体驱动单元提供高保真音效,集成自适应降噪和AI语音聚焦功能,支持杜比全景声和360度空间音频。具备多设备连接、Qi无线充电和超长续航28小时,兼容最新蓝牙LE音频标准。

  • AI日报:AI内容新规正式生效;美团推出开源大模型LongCat;阶跃发布语音大模型Step-Audio 2 mini

    AI日报栏目每日更新AI领域热点内容,聚焦开发者需求。本期重点包括:阶跃星辰发布端到端语音大模型Step-Audio2 mini,在多项基准测试中表现优异;9月1日起AI生成内容需强制标识;美团推出开源大模型LongCat;上海AI实验室发布多模态大模型InternVL3.5;腾讯ARC团队推出音频生成模型AudioStory;OpenAI发布实时语音模型GPT-realtime;Meta与UCSD合作推出DeepConf技术;xAI代码库遭窃事件;阿里巴巴Qwen团队发布GUI自动化框架;微软推出Copilot Labs实验中心;小红书自动化工具xiaohongshu-mcp上线。

  • OpenAI发布语音模型GPT-realtim:具备情感感知能力 多语言无缝切换

    OpenAI正式发布语音模型GPT-realtime。 据介绍,GPT-realtime是一款专注于语音AI Agent的多模态模型,能够生成高度自然流畅的语音,精准还原人类语调、情感和语速的丰富变化。该模型支持图像理解,并可结合语音或文本对话使用,非常适合应用于客服、教育、金融、医疗等领域,用于构建高质量的语音智能体。 官方表示,新模型在复杂指令遵循、工具精确调用以及生成更自然、�

  • 业界首次!华为Mate XTs非凡大师将PC软件装入手机

    华为Mate XTs非凡大师今天下午正式亮相,新增槿紫、皓白两款配色。 余承东介绍,华为Mate XTs非凡大师业界首次将PC装进口袋里,在Harmonyos的加持下,支持自由多窗、全景多窗和多个PC级应用,获得PC般的交互体验。 华为Mate XTs非凡大师业界首次把PC版WPS软件装入手机、业界首次把多窗交互装入手机、业界首次把PC版东方财富装入手机,还有PC版万兴脑图、万兴图示。

  • 苹果首款折叠iPhone细节曝光:支持eSIM、Touch ID回归

    日前,知名科技记者马克古尔曼(Mark Gurman)曝光苹果首款折叠iPhone更多细节。 古尔曼透露,苹果折叠iPhone将配备四颗镜头,分别是外屏前摄、内屏前摄,以及两颗后摄。 另外,新款iPad Air、iPad mini和入门级iPad机型均配备了Touch ID电源键,这一功能可能会延续到折叠iPhone上,而非目前iPhone所使用的面部识别(Face ID)技术。

  • 刘德华一开口 !余承东秒变迷弟:刘德华是我心中的非凡大师

    今日下午,华为Mate XTs 非凡大师及全场景新品发布会如期召开。 现场,华为常务董事、终端BG董事长余承东激动难掩,当众表示:刘德华是我心中的非凡大师! 为何,余承东会对刘德华做出如此高的评价呢? 因为就在刘德华刚刚结束的演讲中,他真诚诠释了华为Mate XTs非凡大师开合间,见非凡”的理念。 此前,刘德华上台后,首先非常谦逊地向台下观众深深鞠了一躬,这�

今日大家都在搜的词: