首页 > AI头条  > 正文

Hume AI重磅发布EVI 3:懂你情绪的语音AI,比GPT-4o还快!

2025-06-03 09:51 · 来源: AIbase基地

近日,Hume AI正式发布了其第三代语音交互模型EVI3,这一全新语音AI以其卓越的情感理解能力和个性化交互体验引发业界广泛关注。EVI3不仅能精准识别用户语音中的情绪,还能根据用户喜好生成特定风格的声音和个性,标志着语音AI在情感交互和自然沟通领域的重大突破。以下,AIbase为您带来关于EVI3的最新资讯和深度解析。

image.png

体验地址:https://demo.hume.ai/

EVI3:情感智能与语音交互的完美融合

EVI3是Hume AI基于多模态数据集研发的第三代语音语言模型,集语音转录、推理和语音合成于一体。相较于前代模型,EVI3在情感理解、语音表达的自然度和个性化定制方面实现了质的飞跃。据官方介绍,该模型能够通过用户输入的简单文本提示,在不到一秒的时间内生成全新的声音和人格设定,支持超过30种复杂的语音风格,赋予AI独特的“性格”或“情绪”。

例如,用户可以通过描述生成“老派喜剧演员”或“睿智巫师”等多样化角色声音,EVI3不仅能精准模仿指定风格,还能根据对话情境动态调整语气和表达方式。这种高度个性化的交互体验,让EVI3在客户服务、虚拟助手、内容创作等场景中展现出巨大潜力。

超低延迟与智能响应:技术性能全面领先

EVI3的推理延迟低至300毫秒,响应速度显著优于OpenAI的GPT-4o,接近新兴技术Sesame,并远超Google的Gemini。在包含1,720名参与者的盲测中,EVI3在情感表达、自然度、语音质量、响应速度、打断处理等七个维度上均超越了GPT-4o,展现出无与伦比的性能优势。

更令人瞩目的是,EVI3能够在对话中实时进行搜索、推理和智能回答。例如,用户在与AI交谈时,EVI3可以一边“倾听”用户语音,一边调用外部工具获取信息,并在对话中无缝融入答案,极大提升了交互的流畅性和实用性。这种端到端的语音处理能力,使得EVI3成为当前语音AI领域的标杆。

情感识别:让AI更懂人类

EVI3的另一大亮点是其强大的情感识别能力。通过分析用户语音的音调、节奏和音色,EVI3能够精准捕捉用户的情绪状态,并据此调整自身的回应语气,营造出更自然、共情的人机交互体验。相比传统语音助手,EVI3在情感表达上的细腻程度更胜一筹,能够模拟人类对话中的停顿、语气变化甚至“umm”等自然口语习惯。

Hume AI表示,EVI3通过强化学习技术对音高、语速和情感风格进行了优化,训练数据涵盖了超过10万个语音样本。这种独特的多模态训练方法,使得EVI3能够从海量数据中提取人类语音的细微特征,从而生成更真实、更具感染力的语音表达。

多场景应用:从客服到内容创作的无限可能

EVI3现已通过Hume AI的iOS应用和在线演示平台向用户开放体验,API接口也将在未来几周内推出,供开发者集成到各类应用中。无论是用于客户服务、健康教练、沉浸式故事叙述,还是虚拟伴侣,EVI3都能提供高度个性化和情感化的交互体验。

例如,在客户服务场景中,EVI3能够根据用户的情绪状态调整语气,提供更贴心的回应;在内容创作领域,创作者可以利用EVI3生成定制化的有声书或游戏角色配音,极大地丰富了创作可能性。Hume AI还计划进一步优化EVI3的多语言能力,未来将更熟练地支持法语、德语、意大利语和西班牙语等语言,拓展全球市场。

Hume AI的愿景:以情感驱动AI未来

Hume AI由前DeepMind研究员Alan Cowen于2021年创立,致力于打造以人类情感和福祉为核心的AI技术。EVI3的发布是Hume AI实现其愿景的重要一步。官方表示,到2025年底,Hume AI的目标是打造一个完全个性化的语音AI体验,让语音交互成为人与AI沟通的主要方式。

相较于OpenAI和Anthropic等巨头专注于提升模型的通用智能,Hume AI更注重语音AI的真实感和情感共鸣。EVI3通过自然语言定制工具,让用户无需复杂的技术操作即可创建专属AI声音,这种用户友好的设计有望推动语音AI的普及和应用。

EVI3的发布无疑为语音AI领域注入了新的活力。其在情感识别、低延迟响应和个性化定制方面的突破,不仅挑战了现有语音AI模型的性能极限,也为未来的AI交互方式指明了方向。AIbase认为,EVI3的出现标志着语音AI从机械化的语音助手向真正“懂你”的智能伙伴迈出了关键一步。

  • 相关推荐
  • AI日报:腾讯重磅发布混元图像3.0;快手发布KAT系列Agentic Coding大模型;苹果悄然研发ChatGPT式应用

    快手发布KAT系列代码大模型,腾讯推出“混元图像3.0”实现多模态突破,苹果研发类ChatGPT应用升级Siri,谷歌更新Gemini 2.5 Flash Lite提升效率。苹果还推出Manzano图像模型,YouTube Music测试AI音乐主播功能,VideoFrom3D框架简化3D视频生成,Moondream 3.0在多项基准测试中超越GPT-5等顶尖模型,展现强大性能。

  • ChatExcel重磅发布:基于AMD锐龙AI MAX+ 395处理器的数据分析Mini AI 工作站

    ChatExcel发布搭载AMD锐龙AI MAX+395处理器的Mini AI工作站,重构数据全链路,打造“找数-做数-分析数-看数-用数”的商业闭环平台。依托处理器96GB超大显存和统一内存架构,实现本地流畅运行GPT-oss-120B等大型模型,保障数据安全的同时显著提升分析效率。该方案以财务场景为例,支持多任务并行处理,将原本需1天完成的月度报表压缩至2小时,解决“数据不外发”与“高效处理”的核心矛盾。

  • AI日报:美图RoboNeo上线首月MAU破百万;影视级音画同步模型Gaga AI发布;vivo蓝心3B端侧大模型发布

    本文汇总AI领域最新动态:美图通过组织变革推动AI应用RoboNeo月活破百万;vivo发布蓝心3B端侧大模型,性能超越8B模型;Gaga AI实现静态照片生成60秒电影级视频;ChatGPT周活用户突破8亿;Figma引入Gemini模型提升设计效率;印度试点AI聊天机器人购物;Figure AI推出第三代家用机器人Figure 03;谷歌推出Gemini Enterprise自动化工作流平台。显示AI正从工具向创作者跃升,加速渗透各行业。

  • AI日报:豆包大模型1.6-vision发布;DeepSeek发布V3.2-exp模型;Claude Sonnet4.5发布

    本期AI日报聚焦多项技术突破:DeepSeek发布V3.2-exp模型,通过稀疏注意力机制降低API成本50%;Anthropic推出Claude Sonnet 4.5,在编码任务表现卓越;ChatGPT新增即时结账功能,实现对话界面直接购物;OpenAI将推出AI版TikTok,所有内容由Sora2模型生成;百度地图升级小度想想2.0,提供智能出行服务;蚂蚁集团开源万亿参数模型Ring-1T-preview;DeepMind提出“帧链”概念,推动视频模型实现全面�

  • 第一!世纪华通旗下Century Games登顶全球Top50手游商

    知名游戏媒体PocketGamer发布《2025年全球TOP50移动游戏商》榜单,世纪华通旗下Century Games从去年第7位跃居榜首,创下该榜单晋升速度新纪录。其成功源于持续创新与精准市场洞察:既实现《Whiteout Survival》等长线产品稳定运营,又凭借《Kingshot》等新作打造跨品类爆款,形成“双强驱动”格局。公司通过“微创新”策略结合AI技术提升研发效率,构建覆盖SLG、休闲、卡牌三大核心品类的产品矩阵。2025年上半年母公司世纪华通营收172亿元,同比增长85.5%,印证了其全球化布局与长效发展潜力。

  • AI日报:Veo 3.1可生成1分钟视频;蚂蚁发布万亿参数语言模型 Ling-1T;Lovart可免费玩Sora2

    本期AI日报聚焦多项技术突破:Veo 3.1视频生成模型实现角色一致性与多场景叙事升级;蚂蚁发布万亿参数Ling-1T语言模型,推理能力领跑行业;xAI推出电影级视频生成模型Imagine v0.9;软银斥资53.75亿美元收购ABB机器人业务布局物理AI;Vercel v0新增图像编辑功能简化设计流程;OpenAI Sora2首日安装量飙升至应用商店第三,同时引发深度伪造伦理担忧;Lovart平台限时免费开放Sora2无水印视频生成;ChatGPT推出应用生态,正式升级为多功能服务平台。

  • 今年双11,「情绪」或是增长解药

    ​走过十七年,双11的热度一年比一年低。 曾经,双11是年度重磅大促,折扣力度空前,代表着低价与省钱。可如今,仅靠价格已经很难打动消费者,再加上促销节点日益频繁,双11也不再是唯一的购物盛宴。 当更多品牌商家跳出“价格战”,试图通过洞察消费者变化寻找增长时,“情绪”或许能成为破解难题的解药之一。

  • 华为AI城市峰会:共建城市数智底座,AI CITY先锋城市案例发布

    9月18日,华为全联接大会2025期间举办AI城市峰会,聚焦智慧城市治理、政务服务与产业升级。华为发布“AI CITY 1234MNX”参考架构,通过智能云底座、安全保障体系及统一平台,推动城市全域智能化转型。会议分享了深圳、广州等地的实践案例,展示AI在政务、城市管理及工业领域的应用成效,并呼吁各方共建AI城市生态,加速数字化进程。

  • AI智能锁首标发布,萤石引领行业新变革

    2025中国国际五金展上,萤石网络联合多家企业发布《AI智能锁》团体标准,这是行业首个团队标准。萤石作为核心制定者,凭借其安全技术、全域自研能力及产品创新,获“AI智能锁引航者”认证。旗舰产品Y5000FVX Ultra搭载双摄、雷达系统,实现精准识别与主动安防,并通过OTA升级持续优化。萤石蓝海大模型2.0赋能智能锁,提供消息服务、视频搜索等智慧入户功能,推动行业从工具向“入户管家”升级。市场数据显示,萤石在高端细分领域销量领先,彰显技术优势与市场认可。

  • vivo自研蓝河操作系统3发布:vivo WATCH GT 2首发

    在2025年vivo开发者大会上,vivo正式发布自研蓝河操作系统3。该系统主打全链路智慧能力,基于轻量、模块化设计,将完整AI方案便捷部署至不同设备。即将发布的vivo WATCH GT 2首发搭载,升级智慧体验。系统内置视觉、听觉及感知唤醒等能力,原生支持AI识别、降噪等功能,并引入蓝心智能,支持问答、语音识别等。流畅度方面,搭载蓝河流畅引擎,实测资源消耗降低60%,绘制效率提升36%,调度切换开销下降58%,资源占用减少40%。

今日大家都在搜的词: