阿里巴巴等开源语音情感基座模型emotion2vec

2024-03-07 08:40 · 稿源：站长之家

站长之家（ChinaZ.com）3月7日消息:情感识别技术在各种场景中都有广泛的应用，如客服机器人根据客户语气调整策略、智能助手根据用户情绪提供建议、情感健康应用监测用户情感状态。为了支持情感理解，上海交通大学、阿里巴巴、复旦大学和香港中文大学的研究者联合开发了通用的语音情感表征模型 emotion2vec。

这个模型利用自监督学习方法在大量无标记的公开情感数据上进行预训练，成功学习到高度通用的语音情感特征。经过多语言和不同场景数据集测试，emotion2vec 在多种情感任务上表现超越了现有技术，为各种情感理解场景提供强大支持，有望提升用户体验和满意度。

微信截图_20240307084128.png

基于 emotion2vec，研究者们进一步开发了语音情感识别基座模型。首先在语音情感识别学术数据集上对 emotion2vec 进行 fine-tune，然后对15万小时中英数据进行标注，筛选文本情感与语音情感相同且置信度高的数据，再次 fine-tune emotion2vec，得到该版本权重。相较于以往工作，通过迭代训练和大幅增加数据量，这个模型可作为语音情感识别的基座模型，已经开源并在 modelscope 上线体验 demo。

emotion2vec 的总体框架包括句子级别损失、帧级别损失和在线蒸馏。句子级别损失通过均方误差计算整体全局情绪，包括单嵌入、块嵌入和全局嵌入三种方法。帧级别损失设计为逐帧任务，学习上下文情绪信息。在线蒸馏是一种自监督学习策略，学生网络通过反向传播更新参数，教师网络通过指数移动平均更新参数，促使模型不断学习提升情感特征捕捉和理解能力。

实验结果显示，emotion2vec 在 IEMOCAP 数据集上表现最佳，性能超越其他 SSL 预训练模型和专家模型。在其他主流英语数据集上也展现出优异泛化能力，证明了其在不同环境中的先进性能。这表明 emotion2vec 不仅在训练数据集上表现优秀，还能适应不同录音环境，为多样情感任务提供支持。

emotion2vec通用语音情感表征模型:

https://www.modelscope.cn/models/iic/emotion2vec_base/summary

emotion2vec语音情感识别基座模型在线体验:

https://www.modelscope.cn/models/iic/emotion2vec_base_finetuned/summary

论文链接:

https://arxiv.org/abs/2312.15185

开源代码仓库:

https://github.com/ddlBoJack/emotion2vec

（举报）

相关推荐

关键词：

OpenAI发布语音模型GPT-realtim：具备情感感知能力多语言无缝切换

OpenAI正式发布语音模型GPT-realtime。据介绍，GPT-realtime是一款专注于语音AI Agent的多模态模型，能够生成高度自然流畅的语音，精准还原人类语调、情感和语速的丰富变化。该模型支持图像理解，并可结合语音或文本对话使用，非常适合应用于客服、教育、金融、医疗等领域，用于构建高质量的语音智能体。官方表示，新模型在复杂指令遵循、工具精确调用以及生成更自然、�

语音模型 GPT-realtime 多模态模型
科龙静省电Ultra上市，跳出空调参数内卷，全能实力重塑用户体验

空调市场竞争激烈，科龙静省电Ultra以硬核实力破局。产品搭载美芝压缩机、7mm铜管等优质硬件，APF值达6.26超一级能效，实现15秒速冷、30秒速热。四向送风消除温差，防直吹设计提升舒适度。经中家院认证，能效稳定领先，满足年轻消费者对性能、节能与场景适配的全方位需求，引领行业回归实效竞争。

空调市场超一级能效性价比
忆联参与制定消费级SSD团体标准正式出版！以“高可靠”引领行业提质增效与用户体验升级

随着AIPC爆发和数据价值凸显，消费级SSD已成为智能体验基石，但行业长期缺乏统一可靠性标准，导致厂商质量对标困难、用户选购无据。近日，《消费级固态硬盘可靠性及环境适应性规范》正式发布，明确产品寿命、极端环境适应性等18项技术指标，填补标准空白。该规范将推动行业建立统一质量基准，助力用户量化评估产品耐用性，促进存储行业高质量发展。

消费级SSD 可靠性标准存储设备
爱在科技中流淌：anyfree自在家与深圳万象食家共筑七夕情感新地标

智能家居品牌anyfree自在家与深圳万象食家合作，打造七夕主题快闪活动“小爪和我的家”，通过科技与情感融合，重新诠释爱的表达。活动强调智能家居产品不仅是实用工具，更是传递持久陪伴与安全感的载体，将抽象情感转化为可感知的日常场景。借助线下沉浸式体验和社交互动设计，品牌致力于让科技有温度，满足现代人对情感联结与守护的需求。

爱的本质科技与情感智能家居
英伟达机器人底层技术突破，微美全息（WIMI.US）多维布局助推产业生态爆发

英伟达发布机器人AI芯片，黄仁勋称AI下一波浪潮将是机器人。上海发布AI+制造方案，推动3000家企业智能化。人形机器人市场前景广阔，预计2030年产量达23万台。微美全息等企业积极布局，在工业与家庭场景加速落地。机器人技术从"炫技"走向实用，正重塑产业结构和生活方式。

英伟达机器人 AI
荐AI日报：即梦上线智能多帧功能；可灵2.1首尾帧升级；钉钉推语音识别大模型Fun-ASR

AI日报栏目汇总近期AI领域重要进展：腾讯元宝接入DeepSeek V3.1提升智能助手能力；即梦AI推出多帧功能简化视频制作；可灵AI首尾帧功能升级效果提升235%；钉钉与通义实验室联合发布Fun-ASR语音识别大模型；腾讯CodeBuddy IDE国内版公测；Vercel发布AI Gateway简化模型调用；Anthropic整合Claude Code强化企业开发；阿里发布Mobile-Agent-v3突破GUI自动化；Qoder平台革新编程模式；清华团队GUAVA框架实现0.1秒3D化身生成；谷歌搜索新增AI Agent功能；VAST推出Tripo 3.0推动3D内容创作。

AI 腾讯元宝 DeepSeek
普渡机器人发布3D感知AI扫地机器人PUDU MT1 Max，重塑智能清洁新高度

普渡机器人于2025年8月20日发布3D感知AI扫地机器人PUDU MT1Max。该产品在MT1基础上大幅升级，搭载3D雷达与多传感器融合系统，显著增强复杂场景感知与避障能力。通过AI技术实现自适应清洁、垃圾识别、巡检清洁等功能，支持10万平方米以上大场景作业。具备自动振尘过滤和智能避雨机制，提升安全性与运维效率，重塑智能清洁行业新标准。

3D感知AI 扫地机器人智能清洁
荐重识vivo：做MR和家用机器人的隐性逻辑

尽管苹果Vision Pro在发布一年后，市场表现并不如其它同门那样好，但2024年它仍以3499美元的高价拿下全球5.2%的市场份额，紧随Meta和索尼之后。当然重要的不是份额，而是苹果对于空间计算的引领，以及对于智能头显市场的推波助澜。 IDC预计，在软硬件技术革新、AI大模型快速发展、交互技术进一步融合的趋势下，2025年全球智能头显市场出货量将同比增长26%至1280万台，其中�

苹果Vision Pro 智能头显市场
智能“机器狗”亮相广博会视源股份四足机器人提供展会、赛事安保新思路

广州博览会上，本土企业视源股份自主研发的四足机器人MAXHUB+X7引发关注。该机器人具备全地形适应能力，可稳定穿越35°斜坡、台阶及沙石路面，支持自主导航、自动执行任务。搭载双摄像头、气体传感器等模块，能替代人工在复杂环境中执行巡检、灭火等任务，适用于展会安保、救援等多场景。其核心价值在于动态风险预测与人机协同响应，已在北京等地的实战中验证能力。产品未来将在广州多个城市管理场景部署，提升生产效率。

机器狗广州博览会四足机器人
元萝卜联动疯狂动物城发布下棋机器人重磅新品，让孩子更聪明、更坚韧、更乐观

商汤科技旗下元萝卜品牌与迪士尼合作，推出《疯狂动物城》朱迪系列下棋机器人。产品融合四种棋类与趣味编程，通过拟人化交互和低挫败成长体系，帮助孩子塑造乐观、坚韧、聪明的性格。外观采用朱迪标志性蓝灰色调，内置启蒙课程，支持人机、人人对弈模式，适合全家互动。售价3499元，预售价3199元。

元萝卜下棋机器人疯狂动物城朱迪系列商汤科技新品

今日大家都在搜的词：

热文

3 天
7天

阿里巴巴等开源语音情感基座模型emotion2vec

OpenAI发布语音模型GPT-realtim：具备情感感知能力多语言无缝切换

科龙静省电Ultra上市，跳出空调参数内卷，全能实力重塑用户体验

忆联参与制定消费级SSD团体标准正式出版！以“高可靠”引领行业提质增效与用户体验升级

爱在科技中流淌：anyfree自在家与深圳万象食家共筑七夕情感新地标

英伟达机器人底层技术突破，微美全息（WIMI.US）多维布局助推产业生态爆发

荐AI日报：即梦上线智能多帧功能；可灵2.1首尾帧升级；钉钉推语音识别大模型Fun-ASR

普渡机器人发布3D感知AI扫地机器人PUDU MT1 Max，重塑智能清洁新高度

荐重识vivo：做MR和家用机器人的隐性逻辑

智能“机器狗”亮相广博会视源股份四足机器人提供展会、赛事安保新思路

元萝卜联动疯狂动物城发布下棋机器人重磅新品，让孩子更聪明、更坚韧、更乐观

今日大家都在搜的词：

热文

雷军凌晨3点就奔赴阅兵观礼台佩戴小米AI眼镜前往

华为MatePad Mini外观公布支持蜂窝网络通话功能

AI日报：AI内容新规正式生效；美团推出开源大模型LongCat；阶跃

人去世了朋友圈会消失？微信客服回应：建议保持账号活跃

AI日报：腾讯开源3D世界模型HunyuanWorld-Voyager；即梦AI系列

苹果新增三款过时产品 iPhone 8 Plus被列为复古产品

腾讯回应被米哈游起诉：没正式程序不能违规提供QQ用户资料

抖音升级AI内容标识功能上线两项核心功能

小米汽车8月交付量超3万台全年交付量有望冲击42万

特斯拉Model 3长续航后轮驱动版降价1万元售价25.95万起

雷军凌晨3点就奔赴阅兵观礼台佩戴小米AI眼镜前往

华为MatePad Mini官宣9月4日发布

今日七夕节微信 520 元大额红包限时上线

首发iPhone 17系列！苹果Apple Store官方旗舰店入驻抖音商城

史上最大Mate！华为智慧屏MateTV将于9月4日发布

AI日报：海螺AI首尾帧功能上线；元石科技发布问小白5；OpenAI发

华为MatePad Mini外观公布支持蜂窝网络通话功能

AI日报：AI内容新规正式生效；美团推出开源大模型LongCat；阶跃

华为上半年营收4270亿元同比增长3.95%：净利润371.95亿元

人去世了朋友圈会消失？微信客服回应：建议保持账号活跃

站长商机