首页 > 业界 > 关键词  > 正文

ChatGPT开口说话了:五种不同语音 语气更像真人

2023-09-26 10:30 · 稿源: 快科技

快科技9月26日消息,OpenAI宣布给聊天机器人ChatGPT增加了语音交谈的功能。这将给谷歌、苹果等巨头在智能语音助手领域带来冲击。

据悉,ChatGPT可以用五个角色”来回答用户的查询,与Alexa和Siri等语音助手相比,它的语气听起来也更像真人。OpenAI表示,增加语音功能是吸引更多用户使用ChatGPT并与其互动的重要方式。

现在,用户不仅可以通过在文本框中输入句子,还可以通过大声说话来提示聊天机器人。

语音助手早已经出现在汽车、智能手机、电视和智能音箱中,每天有无数人使用。但在大多数情况下,语音助手只能进行简单的互动,比如开灯或报天气等。聊天机器人背后的大语言模型”技术开启了一种可能性,让语音助手能够进行更长、更自然的对话,并回答更复杂的问题。

此外,OpenAI还为ChatGPT装上眼睛”,付费用户和企业用户将可以使用图片功能,图片搜索有点像谷歌 Lens,只需拍下感兴趣的照片,ChatGPT 就会找出问题所在,并做出相应的回应。

OpenAI工作人员表示,他们已经测试了语音和图像功能,并增加了安全措施,以确保机器人对敏感话题作出适当的回应。

举报

  • 相关推荐
  • GEO如何改变ChatGPT搜索和Perplexity的游戏规则

    本文对比ChatGPT与Perplexity两大AI搜索平台:ChatGPT作为全能型助手,整合搜索与多任务处理,但存在信息时效性不足;Perplexity专注垂直搜索,强调引用透明与权威来源。针对AI搜索优化(GEO),提出差异化策略:面向ChatGPT需构建结构化知识库、强化品牌实体识别;面向Perplexity需注重权威数据引用和元数据优化。文章还介绍了AIBase的GEO监测工具,通过曝光率等指标量化内容在AI生态中的可见度,并给出可落地的优化行动方案。

  • 如何让你的内容被 ChatGPT 优先引用?——GEO 优化实战指南

    传统SEO追求"谷歌首页排名",生成式AI时代则需追求"被AI引用"。AI模型不提供明确排名算法,更像黑箱,使内容创作者困惑。GEO优化的核心是让内容具备"可引用性":权威清晰、结构化信息、语义覆盖多维度、模型检索映射。需通过AIBase等GEO排名查询工具验证"AI曝光率",分析引用语境、竞争差距,调整内容结构以提升AI引用倾向。SEO优化机器如何找到你,GEO则优化AI如何引用你。

  • 如何提升品牌在AI回答中的提及率?GEO优化3招,让ChatGPT主动提及你的品牌

    本文探讨AI搜索时代品牌面临的"隐身危机",指出AI搜索用户年增538.7%,但品牌在AI回答中提及率不足20%。提出三大核心策略:1)构建权威背书矩阵,通过知乎等高权重平台获取自然提及;2)优化AI友好内容,采用对话式标题和结构化数据;3)建立数据监测闭环,通过A/B测试持续迭代。强调需善用监测工具实时追踪品牌在豆包、文心一言等AI模型的曝光表现,避免内容"注水"。最终实现从"被动等待"到主动抢占AI"第一屏"的转变。

  • OpenAI推出AI浏览器ChatGPT Atlas 开启个性化上网新体验

    OpenAI于10月22日推出首款AI驱动浏览器ChatGPT Atlas,以个性化上网体验为核心。用户点击“Ask ChatGPT”即可在侧边栏实时互动,实现网页摘要生成、航班预订、文档编辑等多样化任务。目前仅支持macOS,未来将扩展至Windows和移动端。高级代理功能暂限付费用户使用,其特色包括自动捕捉页面上下文、分屏浏览及记忆用户操作历史,旨在通过自然对话提升网络使用效率。

  • ChatGPT正秘密测试私信功能:支持用户之间直接交流

    OpenAI正在为其明星产品ChatGPT测试名为私信”(Direct Messages)的社交功能。 这一变化意味着ChatGPT正从原本用户与AI单向交互的语言模型工具,逐步转向具备人与人通过AI连接”能力的社交平台。 OpenAI此次测试的私信”功能允许用户创

  • OpenAI 推出浏览器:“让位吧,Chrome”

    ​北京时间10月22日凌晨,没等来传闻中的Gemini3,等来了OpenAI正式发布首款AI浏览器ChatGPT Atlas。 简单来说,这是一个把ChatGPT"塞进"浏览器的产品,你在任何网页上都能随时唤出ChatGPT侧边栏,让AI帮你总结内容、编辑文字、甚至代替你完成购物和预订任务。 听起来有点像Chrome装了个ChatGPT插件?确实如此,但OpenAI的野心远不止于此。

  • VITA平台赋能AI办公,沸蛇AI语音鼠标提升办公效率

    云决科技推出VITA一站式AI办公平台,结合自研AI语音鼠标,通过软硬件协同创新提升企业效率。该平台集成DeepSeek等大模型,用户无需切换工具,语音即可调用文字处理、数据分析、创意设计等多元功能,实现会议纪要生成、PPT自动制作、视频一键合成等操作,节省80%工作时间。针对教育、IT、行政等不同行业提供专属解决方案,整合100多个AI应用场景和200多种模板,持续优化产品功能,致力于成为职场人士提升效率的智能助手。

  • 499元起!iQOO WATCH GT 2发布:2.07英寸大屏、支持eSIM

    iQOO WATCH GT 2于10月20日发布,起售价499元。配备2.07英寸超亮全景观屏,屏占比82.4%,峰值亮度2400尼特,视野显著提升。蓝牙模式下续航长达33天,较前代提升57%;eSIM模式支持18天续航。支持电竞模式2.0,可实时监测游戏心率,并显示心率浮动窗。具备100+运动模式识别、全天候健康监测及NFC卡包、无网通信等实用功能。提供三款配色,表身仅重33克。

  • vivo自研蓝河操作系统3发布:vivo WATCH GT 2首发

    在2025年vivo开发者大会上,vivo正式发布自研蓝河操作系统3。该系统主打全链路智慧能力,基于轻量、模块化设计,将完整AI方案便捷部署至不同设备。即将发布的vivo WATCH GT 2首发搭载,升级智慧体验。系统内置视觉、听觉及感知唤醒等能力,原生支持AI识别、降噪等功能,并引入蓝心智能,支持问答、语音识别等。流畅度方面,搭载蓝河流畅引擎,实测资源消耗降低60%,绘制效率提升36%,调度切换开销下降58%,资源占用减少40%。

  • AI日报:谷歌发布Veo 3.1;通义千问推Qwen Chat Memory功能;Sora2免费用户可生成15秒视频

    本期AI日报聚焦多项技术更新:谷歌Veo 3.1视频模型新增音频生成与精细化编辑功能;通义千问推出记忆功能提升对话连贯性;Sora2免费用户可生成15秒视频,Pro版支持25秒;百度文心助手升级8种创作模式;谷歌Flow工具增强视频光影编辑与音频合成能力;Anthropic发布高性价比Claude Haiku 4.5;北京查处首例AI虚假广告案,涉伪造主持人带货;阿里推出响应仅200毫秒的编程工具Qoder CLI。

今日大家都在搜的词: