首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

OpenAI 部署新功能,ChatGPT 将具备电话通话能力

2024-05-13 09:53 · 稿源:站长之家

站长之家(ChinaZ.com)5月13日 消息:OpenAI 正在为其流行的语言模型 ChatGPT 部署一项特别的新功能,该功能将使其能够进行类似电话通话的交互。这一更新预计将在周一的某个活动中公布。

1.png

为了实现这一功能,OpenAI 已经部署了必要的 WebRTC(Web Real-Time Communication)服务器。尽管最初人们认为 WebRTC 仅用于 ChatGPT 的语音模式,但后来发现实际上是通过 Livekit 这一流媒体服务来实现的。

新功能的主要特点包括:

  1. 直接语音对话:用户将能够在 ChatGPT 的界面上直接通过语音与其进行对话,类似于传统电话通话。

  2. 增强的互动性:这种新交互方式可能使 ChatGPT 更加互动和实用,为用户提供更丰富的沟通体验。

  3. 语音到文本的转换:目前 ChatGPT 支持的语音功能主要是将用户的语音输入转换为文本,然后以文本形式回复。

  4. 实时语音交流:整合电话通话功能意味着 OpenAI 可能在扩展到更直接的语音交流,允许用户和 ChatGPT 进行实时的语音对话。

  5. 无需屏幕的交流:新的语音对话功能将模拟真实的电话对话,使用户能够在不查看屏幕的情况下与 ChatGPT 进行交流,提高便利性。

OpenAI 的这一创新尝试将 ChatGPT 的应用范围扩展到了更直接的语音交流领域,预示着未来人机交互可能会更加自然和流畅。

举报

  • 相关推荐
  • AI日报:快手推出AI视频制作助手Kwali;字节跳动推出USO模型;OpenAI推出ChatGPT开发者模式

    本文介绍了AI日报栏目,聚焦AI领域最新动态。快手推出Kwali视频助手,简化视频制作流程;字节跳动发布USO模型,解决图像生成中风格与主题的矛盾;微软推出Copilot Audio音频模式,提供个性化语音交互;Stability AI升级Stable Audio 2.5,支持高质量音频生成;阿联酋推出开源大模型K2 Think,拥有320亿参数;微信上线智能回复功能,提升公众号运营效率;OpenAI推出ChatGPT开发者模式,支持AI控制外部工具;字节跳动Seed团队发布AgentGym-RL框架,提升语言模型决策能力;月之暗面开源Checkpoint Engine中间件,优化LLM推理效率;B站开源IndexTTS-2.0文本转语音系统,支持情感与时长控制;Replit推出Agent 3编程助手,自主性提升10倍。

  • AI日报:苹果明年推出SiriAI搜索;OpenAI放开ChatGPT Projects功能;Kimi K2-0905 上线 Discord

    本文汇总了AI领域最新动态:苹果与谷歌合作,计划在Siri中引入Gemini AI技术;OpenAI向免费用户开放Projects功能,提升任务管理效率;谷歌推出免费Gemini CLI工具,集成GitHub提升开发效率;OpenAI估值飙升至5000亿美元,二级股票售出103亿美元;苹果自研AI搜索引擎“世界知识问答”计划2026年上线;月之暗面发布Kimi K2-0905模型,提升编程与创意写作能力;Raycast推出Cursor Agent插件优化代码编辑;谷歌发布nano banana官方Prompt模板,助力创意设计。

  • OPPO Watch S官宣:轻薄表皇

    OPPO宣布将于10月16日推出OPPO Watch S智能手表,主打“轻薄表皇”设计,厚度不足9mm,号称目前市面上最薄的智能圆表。搭载全新智能手表系统,操作体验媲美手机,健康配置亦有惊喜。同时具备“健身教练”功能,可自动识别运动并提供超100种运动模式,专业记录数据。此外,发布会还将推出OPPO Find X9和X9 Pro旗舰手机,首批搭载联发科天玑9500平台,出厂预装全新ColorOS 16系统。

  • OpenAI发布GPT-5-Codex:可完成7小时单次编程任务

    OpenAI宣布推出新一代AI编程模型GPT-5-Codex,其最大亮点是创新的动态时间分配系统。 不同于传统AI追求秒级响应”,该模型可根据任务复杂度灵活调整处理时长,从数秒到7小时不等,以更接近人类专家的决策方式优化代码质量。 GPT-5-Codex产品负责人亚历山大恩比里科斯解释称,传统模型在任务初期即固定计算资源,而GPT-5-Codex能实时评估需求:动态决定加速推进、暂停语法核�

  • StarRocks Connect 2025 圆满落幕:AI Native 时代,数据分析未来已来

    StarRocks Connect 2025峰会圆满落幕,聚焦AI Native时代的数据分析未来。活动汇聚全球开发者与行业专家,分享StarRocks在复杂业务场景中的实践,探讨技术演进方向。从性能引擎到AI原生平台,StarRocks 4.0将支持多智能体协作框架,提升数据分析效率。多家企业展示应用案例,覆盖电商、金融、旅游等领域,验证了其高性能与成本优势。开源精神推动技术创新,共同探索数据智能的无限可能。

  • 苹果Apple Watch高血压通知功能上线

    苹果公司宣布将在全球150多个市场推出Apple Watch高血压通知功能,该功能将随watchOS 26和iOS 26系统更新正式推送。目前英国、法国、德国等地区用户已可体验,但加拿大等部分市场尚未开放,中国大陆地区仍需等待监管审批。该功能依托光学心率传感器,可实时监测用户血管对心跳的反应,识别慢性高血压迹象,并在检测到异常时发出提醒。系统会分析用户最近30天的数据,通过先进算法判断是否需要发出通知。

  • 赫力昂联合Springer Nature旗下自然定制揭秘大脑抗衰

    全球老龄化加速,大脑健康成为焦点。9月16日是中国脑健康日,9月21日是世界阿尔茨海默病日。数据显示,2020至2023年全球60岁以上人口增长40%,达14亿;中国60岁以上人口超3亿,占比22%。阿尔茨海默病带来的经济负担约占GDP的1.47%。科学界正探索维持大脑年轻态的机制,企业合作举办高峰论坛,专家分享前沿研究成果,强调40-60岁是干预黄金窗口期。复合维生素矿物质等营养干预手段显示认知改善潜力,未来需跨学科协作推动大脑抗衰研究普及。

  • 美团发布高效推理模型LongCat-Flash-Thinking:部分性能接近GPT5

    9月23日,美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking。该模型在保持极致速度的同时,性能更强大、更专业,在逻辑、数学、代码、智能体等多个领域的推理任务中达到全球开源模型最先进水平(SOTA),部分任务性能接近闭源模型GPT5-Thinking。它增强了智能体自主调用工具能力,扩展了形式化定理证明能力,成为国内首个结合深度思考、工具调用与非形式化、形式化推理的大语言模型。在数学、代码、智能体等高复杂度任务上表现尤为突出,多项基准测试成绩领先开源及闭源顶尖模型,已在HuggingFace、Github全面开源。

  • 浪漫自在,悦己之声 森海塞尔ACCENTUM Open 真无线耳机 樱花粉上市

    森海塞尔于2025年9月22日在北京发布ACCENTUM Open真无线耳机樱花粉配色。新品在保持卓越音质的同时,以柔和樱花粉点缀耳畔,融合半开放式声学结构与舒适贴耳设计,支持蓝牙5.3多设备连接、双麦克风降噪及28小时续航。耳机单只仅重4.35克,配备IPX4防水,兼顾轻盈佩戴与全天候使用。樱花粉作为继经典黑白后的新配色,将于9月28日正式发售。森海塞尔强调其致力于创新音频解决方案,2025年正值品牌创立80周年,持续为客户打造独特声音体验。

  • 魅族StarV Snap AI拍照眼镜发布:售价1999 元起

    今日下午魅族22新品发布会上,一款名为StarV Snap的AI拍摄眼镜成为全场焦点。这款突破传统智能眼镜形态的产品以39克超轻人因工学设计惊艳亮相,通过50项人体工程学优化实现重量均匀分散,彻底解决"丑、重、硌"的行业痛点,鼻梁、耳部无压迫感的设计支持全天候舒适佩戴。 外观采用经典框型设计,磨砂质感镜框不仅时尚百搭适配多种脸型,更具备防指纹沾染特性,

今日大家都在搜的词: