首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

OpenAI申请“Voice Engine”商标,瞄准语音助手市场

2024-03-27 09:58 · 稿源:站长之家

划重点:

🔍 OpenAI发布“Voice Engine”商标,意味着它将挑战苹果、亚马逊和谷歌等巨头在数字语音助手市场的主导地位。

🚀 “Voice Engine”项目涵盖一套技术,旨在创建综合性虚拟语音助手,利用OpenAI现有的人工智能能力。

🎙️ ChatGPT的“朗读”功能以37种语言发出响应,显示了OpenAI改善用户体验的决心。

站长之家(ChinaZ.com)3月27日 消息:在一项大胆的举措中,ChatGPT的开发者OpenAI已经为一项名为“Voice Engine”的工具提交了商标申请,这表明了潜在的数字语音助手市场格局可能会发生变化。这一战略举措可能会使OpenAI成为苹果、亚马逊和谷歌等已经主导市场的科技巨头的强劲竞争对手。

image.png

OpenAI进军语音技术领域,推出“Voice Engine”意味着它正在专注于将其在人工智能领域的实力延伸到数字语音助手领域。这项商标申请提交给美国专利和商标局,概述了一套包括软件在内的语音相关技术,突显了OpenAI雄心勃勃的创新计划,超越了其当前的能力。

该技术套件包括用于创建数字语音助手、处理语音命令、从文本提示生成音频以及支持多语言语音识别和翻译的软件。这些技术进步建立在OpenAI现有的技术基础之上,包括文本到语音API和Whisper语音识别模型,标志着向消费者提供完全集成的虚拟语音助手迈出了重要一步。

ChatGPT中“朗读”功能的推出,可以在37种语言中表达响应,突显了OpenAI改善用户通过语音进行交互的决心。这一功能不同于Whisper专注于理解和回应语音的功能,它结合了书面和口头交流,为用户提供了更全面、更方便的体验。这一发展特别适合那些需要同时处理多项任务或更喜欢听觉学习的用户。

OpenAI的首席执行官Sam Altman暗示今年将推出“很多不同的东西”,有关Sora(AI视频工具)以及可能的新AI语音系统的猜测不绝于耳。尽管有关“Voice Engine”或其产品化的具体细节尚不清楚,但OpenAI的商标申请已经充分展现了其意图。除了消费者应用之外,“Voice Engine”还可能意味着企业的一场竞赛,使公司能够通过先进的语音系统提高呼叫中心的效率。

OpenAI进军数字语音助手市场并非一帆风顺。该公司遇到了诸如“GPT”商标被拒绝等监管障碍,但它继续努力为未来版本如GPT-5、GPT-6和GPT-7获取商标。随着GPT-5的发布预计在今年夏天,OpenAI仍然处于人工智能创新的前沿。

通过为“Voice Engine”提交商标申请,OpenAI不仅扩展了其技术生态系统,还构想了一个未来,其中人工智能助手将更加不可或缺地融入日常生活。通过将语音作为主要交互方式,OpenAI旨在促进无缝沟通,弥合人类意图和机器理解之间的差距。

举报

  • 相关推荐
  • 人声接近真人!OpenAI一口气更新三款超强语音AI

    OpenAI正式宣布对其实时API接口进行重大升级,一次性推出三款全新高阶语音智能模型,全面强化AI在实时听觉、口语交互、翻译与转录方面的能力,并大幅降低企业开发智能语音应用的技术门槛。 本次更新的核心产品包括:GPT-Realtime-2、实时翻译模型以及实时转写模型。其中,GPT-Realtime-2搭载了GPT-5级别的推理能力,人声仿真度进一步提升。 相比前代产品,它能够更精准地理�

  • OpenAI成立OpenAI部署公司:帮助企业构建人工智能系统

    OpenAI正式成立OpenAI 部署公司”,在帮助企业构建人工智能系统。 同时,OpenAI已同意收购Tomoro一家专注于将AI转化为运营优势的应用 AI 咨询与工程公司。 新成立的部署公司由OpenAI控股,无论客户是与OpenAI、OpenAI部署公司,还是与两者同时合作,都将获得统一的服务体验。

  • AI新王诞生!Anthropic估值冲爆1.2万亿 首次反超OpenAI

    长期笼罩在OpenAI阴影下的二号选手”Anthropic,近期在链上Pre-IPO市场的隐含估值骤然飙升至1.2万亿美元(约合人民币8.7万亿元)。 若Anthropic以这一估值顺利完成首次公开募股,它将直接跃升为全球第11大上市公司,缔造商业史上的新神话。 最新链上Pre-IPO交易数据显示,短短七天内,Anthropic估值暴涨20%,单周涨幅已相当于一家头部上市公司的体量。而自2025年10月以来,其估值曲

  • AI日报:腾讯发布设计智能体Ardot;千问5月20日将发布重大模型;OpenAI推出ChatGPT个人理财工具

    本期AI日报聚焦八大热点:腾讯发布AI设计平台Ardot,一句话生成可编辑设计稿并一键转代码;通义千问“重量级”大模型将于5月20日阿里云峰会亮相,实现全面升级;AI大模型在基层警务中落地,豆包助力破获柴油盗窃案;Google I/O大会将推出Gemini 4.0等创新产品;索尼澄清Xperia 1XIII的AI相机助手仅提供拍摄建议;OpenAI推出ChatGPT个人理财工具,结合GPT-5.5支持连接银行账户;中国大模型周调用量连续三周超越美国,腾讯Hy3 preview以2.66万亿Token领先;红果短剧回应取消AI仿真人剧本保底传闻,称部分剧本仍保留保底政策。

  • AI日报:OpenAI发布三款实时语音模型;苹果首款AI硬件曝光;美团入局AI社交赛道

    今日AI热点:OpenAI发布三款实时语音模型,覆盖推理对话、翻译和转录场景;苹果首款AI硬件AirPods进入DVT阶段,内置摄像头;宇树科技UniStore平台开放,开启人形机器人应用商店时代;阶跃星辰完成25亿美元融资,冲刺香港IPO;美团推出首个数字生命共生社区“鲸游”公测;OpenAI推出GPT-5.5-Cyber预览版,专攻网络安全;Mozilla借助AI发现Firefox 271个安全漏洞;OpenAI发布Codex Chrome扩展,优化浏览器工作流。

  • 出门问问CodeBanana入选36氪「2026 AI最佳场景渗透案例」:AI协作从工具走向组织操作系统出

    36氪公布“2026 AI最佳场景渗透案例”评选结果,出门问问的AI原生协作平台CodeBanana(CB)凭借在企业协作中的深度实践入选。该评选历时3个月,从场景渗透度、商业价值力、技术创新力、可复制性四个维度,覆盖10余个领域,从数百案例中精选出标杆。CB以“项目”为核心,实现多角色实时并行协作、技能市场、A2A跨项目协作、Cron Job主动工作及企业级可控可审计五大能力,将《超级组织》理念落地,研发实现100% AI Coding,产研效率提升4倍,Token成本仅占人力成本约15%。

  • DeepSeek回应“乱回”漏洞:特殊字符引发模型幻觉

    面对近期网络上愈演愈烈的隐私泄露猜测,DeepSeek官方今日正式作出回应。一份关于特定字符触发模型异常回复的说明被发布出来,试图为这场“串台”风波画上句号。 DeepSeek技术团队在全面排查后,给出了完全否定的结论。官方的解释是,输入“think”等字符后所返回的异常内容,实质上属于一种特殊字符引发的“模型幻觉”,并不涉及任何安全层面的问题,更不是隐私泄露

  • DeepSeek回应信息“串台”BUG:特殊字符引发模型幻觉 不会泄露隐私

    近期有网友反映DeepSeek输入“think”字符会出现隐私泄露问题,模型输出无关内容且结果各异。DeepSeek官方今日发布说明称,经排查,该现象属于特殊字符引发的模型幻觉,不涉及安全或隐私泄露。后续将通过针对性训练增强模型对特殊字符的识别与处理能力,优化相关表现。公司始终重视用户数据安全与体验,感谢关注与监督。

  • AI日报:豆包披露付费订阅方案;OpenAI发布GPT-5.5Instant;苹果手机支持第三方AI模型

    今日AI领域动态:豆包推出月费68-500元三档付费订阅,推进商业化;OpenAI发布GPT-5.5 Instant,取代5.3成为ChatGPT默认模型;苹果iOS 27或支持第三方AI模型,打破封闭生态;淘宝“答题免单”上线,首次加入AI试穿玩法;魔形智能完成数亿元Pre-A轮融资,布局Token基础设施;谷歌神秘项目“Remy”曝光,打造24小时AI助教;谷歌推出Gemini Ultra Lite新订阅服务,填补中高端市场空白;ChatGPT上线广告主平台,AI商业化迎来分水岭。

  • OpenAI憋不住了要造手机!背后原因曝光:不想再给苹果谷歌白打工

    估值超8000亿元的AI大模型巨头OpenAI计划自研AI手机,预计2028年量产,由立讯精密制造,正与联发科、高通合作研发处理器。 消息一出,立讯精密股价大涨超9%,创历史新高。 OpenAI CEO奥尔特曼也表示,当前需重新思考操作系统与界面设计,打造适配智能体的互联网协议。 为何大模型企业纷纷下场造机?核心原因直指不想再被苹果、谷歌卡脖子”。 首先,摆脱第三方终端依赖

今日大家都在搜的词: