首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

OpenAI申请“Voice Engine”商标,瞄准语音助手市场

2024-03-27 09:58 · 稿源:站长之家

划重点:

🔍 OpenAI发布“Voice Engine”商标,意味着它将挑战苹果、亚马逊和谷歌等巨头在数字语音助手市场的主导地位。

🚀 “Voice Engine”项目涵盖一套技术,旨在创建综合性虚拟语音助手,利用OpenAI现有的人工智能能力。

🎙️ ChatGPT的“朗读”功能以37种语言发出响应,显示了OpenAI改善用户体验的决心。

站长之家(ChinaZ.com)3月27日 消息:在一项大胆的举措中,ChatGPT的开发者OpenAI已经为一项名为“Voice Engine”的工具提交了商标申请,这表明了潜在的数字语音助手市场格局可能会发生变化。这一战略举措可能会使OpenAI成为苹果、亚马逊和谷歌等已经主导市场的科技巨头的强劲竞争对手。

image.png

OpenAI进军语音技术领域,推出“Voice Engine”意味着它正在专注于将其在人工智能领域的实力延伸到数字语音助手领域。这项商标申请提交给美国专利和商标局,概述了一套包括软件在内的语音相关技术,突显了OpenAI雄心勃勃的创新计划,超越了其当前的能力。

该技术套件包括用于创建数字语音助手、处理语音命令、从文本提示生成音频以及支持多语言语音识别和翻译的软件。这些技术进步建立在OpenAI现有的技术基础之上,包括文本到语音API和Whisper语音识别模型,标志着向消费者提供完全集成的虚拟语音助手迈出了重要一步。

ChatGPT中“朗读”功能的推出,可以在37种语言中表达响应,突显了OpenAI改善用户通过语音进行交互的决心。这一功能不同于Whisper专注于理解和回应语音的功能,它结合了书面和口头交流,为用户提供了更全面、更方便的体验。这一发展特别适合那些需要同时处理多项任务或更喜欢听觉学习的用户。

OpenAI的首席执行官Sam Altman暗示今年将推出“很多不同的东西”,有关Sora(AI视频工具)以及可能的新AI语音系统的猜测不绝于耳。尽管有关“Voice Engine”或其产品化的具体细节尚不清楚,但OpenAI的商标申请已经充分展现了其意图。除了消费者应用之外,“Voice Engine”还可能意味着企业的一场竞赛,使公司能够通过先进的语音系统提高呼叫中心的效率。

OpenAI进军数字语音助手市场并非一帆风顺。该公司遇到了诸如“GPT”商标被拒绝等监管障碍,但它继续努力为未来版本如GPT-5、GPT-6和GPT-7获取商标。随着GPT-5的发布预计在今年夏天,OpenAI仍然处于人工智能创新的前沿。

通过为“Voice Engine”提交商标申请,OpenAI不仅扩展了其技术生态系统,还构想了一个未来,其中人工智能助手将更加不可或缺地融入日常生活。通过将语音作为主要交互方式,OpenAI旨在促进无缝沟通,弥合人类意图和机器理解之间的差距。

举报

  • 相关推荐
  • OpenAI也来了,巨头为何决战AI浏览器?

    AI浏览器赛道再添一位重量级玩家——ChatGPT Atlas,这是OpenAI推出的首款人工智能驱动的网页浏览器。 这也被外界认为OpenAI要向谷歌宣战,挑战Chrome一直以来的浏览器霸王地位。ChatGPT Atlas发布当天,谷歌母公司Alphabet股价应声下挫,盘中最大跌幅接近5%,足见市场对这一新品的敏感度。 近一年来,AI浏览器的战略价值成为行业共识,从业者更是将其与智能代理(Agent)、搜索引�

  • OpenAI 推出浏览器:“让位吧,Chrome”

    ​北京时间10月22日凌晨,没等来传闻中的Gemini3,等来了OpenAI正式发布首款AI浏览器ChatGPT Atlas。 简单来说,这是一个把ChatGPT"塞进"浏览器的产品,你在任何网页上都能随时唤出ChatGPT侧边栏,让AI帮你总结内容、编辑文字、甚至代替你完成购物和预订任务。 听起来有点像Chrome装了个ChatGPT插件?确实如此,但OpenAI的野心远不止于此。

  • OpenAI推出AI浏览器ChatGPT Atlas 开启个性化上网新体验

    OpenAI于10月22日推出首款AI驱动浏览器ChatGPT Atlas,以个性化上网体验为核心。用户点击“Ask ChatGPT”即可在侧边栏实时互动,实现网页摘要生成、航班预订、文档编辑等多样化任务。目前仅支持macOS,未来将扩展至Windows和移动端。高级代理功能暂限付费用户使用,其特色包括自动捕捉页面上下文、分屏浏览及记忆用户操作历史,旨在通过自然对话提升网络使用效率。

  • 苹果前CEO发声:OpenAI成苹果AI时代劲敌 Siri显得十分滞后

    曾担任苹果首席执行官的约翰斯库利近日公开表示,OpenAI已成为苹果几十年来首个真正意义上的竞争对手,并直言人工智能并非苹果特别擅长的领域”。 从实际情况看,苹果在人工智能竞赛中确实表现欠佳。与OpenAI、谷歌、亚马逊和Meta等公司持续推出的产品更新相比,苹果显得步伐迟缓。今年早些时候,其对AI助手Siri进行全面升级的计划被推迟,这无疑在产品推进方面遭遇�

  • AI日报:OpenAI发布浏览器Atlas;通义Qwen3-VL新增2B、32B两个模型尺寸;百川发布循环证据增强大模型

    本文汇总AI领域最新动态:OpenAI推出集成ChatGPT的Atlas浏览器,实现多任务自主处理;阿里通义千问新增2B/32B视觉语言模型,手机可流畅运行;谷歌AI Studio升级Vibe Coding功能,简化应用开发流程;百川发布医疗大模型M2Plus,通过循证推理降低误诊率;奇瑞墨甲机器人实现L3级技术突破,计划多行业应用;YouTube推出AI肖像识别工具,打击虚假内容;三星宣布2026年推出AI眼镜,融合AR与语音助手;Claude客户端更新,支持截图分析和语音交互功能。

  • 全新开源的DeepSeek-OCR,可能是最近最惊喜的模型。

    ​AI圈虽然天天卷,但是很多的模型,真的越来越无聊了。 每天就是跑分又多了几个点。 直到昨天,DeepSeek久违的发了一个新模型。 DeepSeek-OCR。 这玩意,是真的有点酷。

  • AI日报:视觉中国与多家大模型公司达成合作;OpenAI紧急暂停Sora生成已故名人;谷歌推出Gemini地图数据集成工具

    视觉中国与多家AI公司合作开发可商用视觉大模型,已获阿里、微软等订单。OpenAI因不当内容暂停Sora生成马丁·路德·金形象视频,引发AI伦理讨论。DeepSeek在加密货币交易实验中表现领先。WhatsApp将禁止第三方通用AI聊天机器人,仅保留Meta AI。宇树科技推出仿人机器人Unitree H2,具备拟人化设计。谷歌为Gemini集成地图数据工具,可访问25亿地点实时信息。Opera推出集成三款AI助手的Neon浏览器,但用户体验存在困惑。Facebook在美加推出AI照片编辑建议功能,可分析手机未分享照片。

  • 华为FreeClip 2耳夹耳机正式开售:售价1299元 搭载NPU AI处理器

    华为FreeClip 2耳夹耳机10月20日开售,售价1299元。预售1小时销量破8万台,市场热度高。性能方面搭载自研低功耗芯片与NPU+AI处理器,算力提升10倍;配备超澎湃双引擎单元,响度与低频动力均翻倍。支持L2HC高清音频编码,音质清晰。新增鸿蒙AI耳边助手,支持智能播报、翻译等功能。设计采用亲肤液态材质与C形桥结构,单耳重5.1克,佩戴舒适且具备IP57防护。续航方面单次使用9小时,配合充电仓总续航达38小时,充电10分钟可用3小时。预计2025年底将升级星闪音频体验。

  • DeepSeek开源3B OCR模型:长文本识别达97%精度

    DeepSeek在GitHub开源新一代OCR模型,采用创新光学二维映射压缩技术,在长文本识别场景实现97%准确率。模型通过动态压缩生成最优视觉特征令牌,较传统方法减少60%计算冗余。实验显示在1:20压缩率下仍保持60%以上准确率,显著优于同类模型。该技术路径为OCR系统小型化提供解决方案,其动态压缩策略对大型语言模型的记忆管理机制具有重要启示。

  • 全球首个!OpenAI将推“AI版抖音”:禁止上传实拍内容 视频100%由AI生成

    国庆假期前夕,OpenAI发布了Sora 2,一款旗舰视频和音频生成模型。 据介绍,Sora 2可以完成以前的视频生成模型难以完成的事情,比如运动员的奥林匹克体动作、桨板上的后空翻,准确模拟浮力和刚度的动态等等,并擅长现实主义、电影和动漫风格。 一则来自《连线》杂志的重磅爆料更是指出,OpenAI的下一步棋,并非简单升级一个模型,而是要亲自下场,推出一个独立的AI影�

今日大家都在搜的词: