首页 > 业界 > 关键词  > 语音模型最新资讯  > 正文

OpenAI发布语音模型GPT-realtim:具备情感感知能力 多语言无缝切换

2025-09-01 08:28 · 稿源: 快科技

快科技9月1日讯,OpenAI已正式推出语音模型GPT-realtime

据悉,GPT-realtime是一个聚焦于语音AI Agent多模态模型,能够产出极为自然流畅的语音,精确再现人类语调、情感以及语速的丰富多样变化。此模型支持图像理解,还能与语音或文本对话相结合运用,特别适用于客服、教育、金融、医疗等领域,用以构建高品质的语音智能体。

官方宣称,新模型在复杂指令执行、工具精准调用以及生成更自然、更具表现力的语音方面表现出色。尤其是在重复字母与数字、逐字宣读免责声明、语句间无间断切换语言等场景中,GPT-realtime展现出良好的适应能力。

该模型还拥有卓越的上下文理解能力,能够精准捕捉非语言线索(比如笑声),并实时调节语音语气,达成诸如带有法国口音的友好语调”或者语速较快的专业语调”等多种表达。

另外,GPT-realtime增添了Cedar”和Marin”两种语音风格,并且对现有的八种语音效果进行了全方位优化。

OpenAI发布语音模型GPT-realtim:具备情感感知能力 多语言无缝切换

举报

  • 相关推荐
  • 合合信息多模态可信AI鉴伪系统亮相中国图像图形大会,人脸伪造拦截率提升8倍

    AI伪造内容泛滥,不法分子利用AIGC技术实施诈骗,传统鉴伪技术受限于复杂传播环境。合合信息在2026中国图像图形大会上展示多模态可信鉴伪系统,能识别Chat-GPT、Midjourney等主流模型产出内容,应对身份造假、证件欺诈等风险。该系统已在金融、保险、电商等三十余场景落地,如某国有银行上线后人脸伪造拦截率提升8倍,有效净化交易环境。未来将持续迭代技术,筑牢数字安全屏障。

  • 科龙云朵猫Ultra上手:星闪雷达+DeepSeek语音,智能柜机选它就对了

    买空调最易踩的坑不是匹数选小,而是花大几千买回家却发现风只往一个方向吹、角落的人感受不到凉意、调温还得满屋找遥控器。科龙云朵猫Ultra在3000-5000元价位,用星闪雷达和双语音大模型给出了够聪明、够舒适的答案:星闪雷达2.0能精准感知6米内多人位置,实现风避人、风随人、人近柔风、人离节能四大模式;内置DeepSeek与星海大模型,支持6种方言识别和离线语音控制;170°超广角送风搭配216种风感组合,APF值高达5.30,远超新一级能效标准26%,AI懒人省电模式再省35%。对比美的酷省电PRO和TCL智炫风,它在人体感知、复杂语音指令和柔风技术上优势明显,全生命周期性价比极高,尤其适合有孩有宠或多代同堂家庭。

  • 谁来给阿里Agent扛旗?

    “QoderWork的日活、周活、Token用量,在集团所有AI工具里都是第一。” 上周五,阿里巴巴CEO吴泳铭现身QoderWork团队会时,给出了这组内部口径。字母榜从阿里相关人士获悉,吴泳铭在会上提到,QoderWork正在成为“打通大模型和整个数字世界的接口”,未来要帮助所有办公室白领,成为类似OS的存在。 这句话出现的时间点很微妙。 同一时期,钉钉刚经历一场人员风波。CEO无招�

  • 自变量机器人王昊:训练世界模型需付出“时间税”,解决模态对齐是当务之急

    2026北京智源大会聚焦世界模型,自变机器人CTO王昊提出“事件驱动的世界模型”理念,强调智能在特定尺度涌现。其发布的事件级世界模型WALL-WM,以事件为数据边界统一语言、视觉和动作,在具身视频生成、隐式3D感知及真机测试中表现优异,全面超越现有模型。自变机器人还开源了VLA模型和低成本数据采集方案,推动具身智能发展。

  • 腾讯网盘官网上线:打通AI!支持多应用数据互通、Agent调用

    腾讯上线AI网盘,主打打通人工智能应用生态,实现多端数据互通与资产沉淀。可连接多款AI应用,统一存储数据形成可复用资产。功能包括统一身份认证、跨应用搜索、高效共享协作及支持智能代理调用。提供个人、SaaS等多版本交付,但尚未公布正式发布时间。

  • XR 新时代开启:XREAL AURA 正式开启预订,深度集成 Android XR+Gemini AI

    XREAL在加州长滩正式发布下一代空间计算眼镜XREAL AURA,基于Android XR平台,与谷歌、高通合作打造。该产品融合轻量化OST光学透视设计、深度集成的Gemini AI及最新骁龙平台,将于2026年秋季上市。目前已开放预订,并展示丰富的游戏、娱乐、生产力及医疗等领域生态,CEO徐驰称其标志空间计算眼镜新时代开启。

  • 语音驱动落地运营:小云AI店长,打破AI运营工具 “只会献策、不会干活” 行业困局

    在当前本地生活数字化浪潮中,实体商家面临AI运营工具功能单一、操作复杂、落地难等痛点。小云AI店长通过语音运营、全域研判和实操落地三大核心能力,以全场景语音交互降低使用门槛,整合多平台数据提供精准诊断,并实现运营方案一键自动化执行,大幅降低成本和操作难度,让中小实体店以低成本实现数字化精细运营。

  • 大模型调用成本暴跌90%,盘活数据成为企业AI落地胜负手

    本月DeepSeek V4Pro开启永久降价,价格仅为原来的四分之一,缓存命中低至0.025元每百万token,引发行业“跳水式降价”。随着模型效率提升、算力成本优化和市场竞争加剧,大模型调用成本全面下行已成共识。国内公有云大模型API均价较2023年已下跌超90%,性能提升3至5倍。AI普惠时代来临,企业接入门槛快速抹平,但决定AI落地效果的核心变量转向企业自身的数据根基。数据准确性、治理规范、权限管理及智能体对核心数据的安全高效访问,直接影响AI应用效果。Gartner研究显示,85%的失败AI项目源于数据质量缺陷。数据底座正成为企业业务效率与决策方式的关键基础设施,逻辑数据管理路径被越来越多企业验证:在分布式环境上构建可信、实时、可治理的逻辑数据层,让智能体在不触碰数据物理位置的情况下安全、准确、实时获取所需,将AI能力真正嵌入业务流程。Agent时代,模型是入场券,数据才是护城河。

  • Testin云测XAgent:破解多端脚本维护难题

    随着技术管理焦点从“能否发布”转向“能否稳定运行”,测试效能成为核心变量。全球自动化测试市场预计2026年达404.4亿美元,云测试已成行业标配。针对终端碎片化、成本双高、场景复杂等挑战,AI测试通过自然语言生成脚本、跨平台复用、高精度识别等技术实现突破。云测试模式将固定资本转化为可预测运营支出,建议技术管理者从脚本维护、设备覆盖、流程联动、数据

  • WPS笔记正式发布:AI能力贯穿记录全过程 支持图文、语音多源录入

    金山办公正式发布AI原生多模态笔记产品WPS笔记。 该产品支持语音、图片、文字、网页等多种信息录入方式,将AI能力贯穿从记录到复用的全过程,旨在破解收藏即遗忘”的知识管理难题。 WPS笔记已于今年3月开启内测,累计吸引超过1万名用户参与,其中4000余名用户持续反馈并参与产品共创。 产品研发负责人陈泳豪表示,AI时代的知识工

今日大家都在搜的词: