首页 > 传媒 > 关键词  > 正文

好声音上线|标贝科技多情感音色 让人机交互更深入人心

2023-07-19 13:52 · 稿源: 站长之家用户

一直以来,“声音”作为大脑中最基础的记忆类型,为情感内容创造发挥重要作用。对于智能语音产品而言,声音的表现力尤为重要。在人工智能飞速发展的今天,智能语音已经无处不在,通过富含多种情感的语音呈现,为我们的生活增添更多欢乐和色彩。

人机交互 越来越需要“感情”

从早期的机械化语音合成发展至今,在深度学习的推动下,语音合成的自然度和音质都得到了极大的提升。应用领域也从相对简单、单一的场景,升级到更复杂、综合的场景,对合成声音的辨识度、情感表现力、节奏感等要求越来越高。事实上,不同场景和文本类型,对声音的要求也不同。在日常语言对话中,我们通常会用一些明显的情感信号来强化声音的效果。例如,开心、愤怒、疑惑、惊惧等不同情绪下说同一句话,但听起来的感觉是截然不同的。随着人们对完全沉浸式视听体验追求的不断增加,情感音色的重要性只增不减。人机交互过程中,人们越来越需要机器给予“感情”回馈,让彼此的交流更有真实感。

情感合成 赋予AI语音“人情味”

如果说语音合成技术为机器人装上了嘴巴,而情感合成则丰富了机器的情感表达。让机器具有“人情味”,能“哭”会“笑”,满足不同情境下的不同语意表达,为人机交互赋予情感温度。例如,在智能客服场景,面对顾客投诉反馈意见时,智能客服需要用抱歉的情感音色来表达对顾客的歉意;在有声阅读中,不同角色、不同感情特征的声音,更能推动故事情节的转承起伏;在虚拟主场景里,一个热情、有感染力的专属IP声音,更能调动观众的主动性。因此,如何让合成语音具备人声的情感表现力,成为语音合成重要发展方向。

标贝科技多风格多情感合成音色

标贝科技深耕AI语音交互领域多年,致力于语音交互技术的创新研发和商业化应用,推出包括普通声音复刻、精品声音复刻、TTS标准化定制等多种个性化音色定制解决方案。

对于语音合成的情感表现场景,标贝科技依托于成熟的深度学习技术,充分利用多风格情感语音大语料单独预训练技术,实现了风格拓展、情感控制等方面的重要突破,重新定义和升级了情感合成方案,实现了更加接近真人情感化表达的声音效果。

近日,标贝科技再上新 7 个多情感发音人,包括 3 个男声、 3 个女声以及 1 个童声音色。支持开心、生气、可爱、安慰、中性等多种风格多种情感表达,适用于虚拟数字人、有声读物、纪录片、直播、游戏解说等场景需求。

标贝科技多情感音色特点

▍多情绪多风格

标贝情感音色提供真实自然的开心、悲伤、惊讶、恐惧、厌恶、中性等多种情绪以及闲聊对话、客服、新闻等多种风格音色,以声传情,适用于不同情境下的不同语意表达。

▍音色效果真实饱满

标贝情感音色基于成熟的深度神经网络技术及新一代高音质合成系统生成,合成效果更接近真人的韵律、情感,真实流畅,可实现高度拟人化的情感表达。

▍场景音色定制化

支持情感强弱、语速、音量等关键声音属性调节,用户可以根据场景的情感连续性,进行更加契合的语速和语气调整,随心创造专属的情感音色。

目前,标贝科技多情感风格音色已经在标贝官网、标贝开放平台同步上线。据悉,近期标贝还将上新更多的情感音色,欢迎各应用厂商、及企业开发者体验接入。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • 好声音上线|8款高品质个性化场景音色,欢迎体验!

    AIGC的应用推动了智能语音产业进入大规模落地阶段,用户对语音交互的需求越来越大,情感语音合成技术的发展也越来越受到关注。特别是随着语音技术在语音克隆、虚拟人音色定制等个性化场景的应用,语音交互的实时性、情感化要求进一步增强。随着语音技术的不断进步和应用场景的持续扩展,标贝科技也将进一步完善语音技术和服务能力,为用户带来更加便捷、高效的人机交互体验。

  • 标贝科技进阶版声音克隆 3小时即可实现高质量精品复刻!

    说到声音克隆,大家都不陌生。开车时听“志玲姐姐”为你导航,看书时“喜欢的爱豆”给你讲故事,听“AI孙燕姿”唱脍炙人口的流行歌曲,听“马三立”讲相声等等,这都是声音复刻技术在生活中的具体应用。声音克隆,也称声音复刻,通过使用AI模型对大量的数据进行学习和训练,从而得到与用户本人在音色和发音风格上非常相似的声音模型,快速“复刻”个性化声音。用以弥补传统语音合成技术在数字化人声上的不足,生成纹理更为真实丰富的声音。近年来,随着智能语音产业的快速发展,语音合成技术得到了广泛应用,而声音复刻作为语音合成拓展出

  • 云从科技数字人云月正式上线

    云从科技宣布数字人云月正式上线,她具备高度的拟人化呈现,能够听懂、看懂、有记忆、自学习,与人进行自然交互。云从科技在数字人云月的研发过程中,利用了多年来在人工智能领域的积累和创新能力,自主打造了数字人服务平台。未来云月将不断优化,解锁更多的行业大模型技能,为人们的生活带来更多智能化。

  • 孙红雷诉游戏软件声音侵权:系全国首例影视剧台词声音权纠纷案

    成都互联网法庭开庭审理全国首例影视剧台词声音权纠纷案。孙红雷认为,《西瓜摊主大战买瓜人》游戏软件中使用了孙红雷参演的电视剧《征服》经典桥段中的台词声音该款游戏中自己的人格元素被塑造成了坏人形象,其人格尊严未被尊重,客观上构成对其一般人格权的侵犯。使用方未经权利人许可擅自使用的,则构成侵权。

  • 《王者荣耀》这个大胆的决定,为什么让玩家直呼大快人心

    不少人发现《王者荣耀》又有大动作了放到整个手游圈里都挺炸裂——现在在游戏对局中,如果系统检测到有挂机、摆烂之类恶劣行为的玩家,其他队友就可以通过投票把他踢出去,并且由AI来接管角色。对于这个MOBA手游里从未有过的新功能,一些玩家直呼,这次是“正常玩家的大胜利”。更进一步来说,我想这还不仅是竞技游戏的产品问题——当原本带给我们快乐的游戏环�

  • 小赢科技《城市之光·发光的年轻人》用户故事上线 北京“追光英雄”

    一个城市的温度,离不开每一位平凡努力的普通人,也离不开每一家编织梦想的小店,它们像极了城市里富有韧性的“毛细血管”,构成了每座城市的基石,用星星点点的城市之光增添了城市的烟火气。为了帮助这些韧性生长、向阳乐观的“城市之光”,小赢科技推出“城市之光”助力计划,将重点为小微企业、个体户以及新市民提供全面的帮扶与支持,助力他们在市场经营中脱颖出。小赢科技将持续不断创新,紧贴政策导向,让“城市之光”助力计划的实施为每一座城市、每一间店铺、每一位小微企业主和新市民守护梦想,带来希望。

  • ChatGPT重磅升级:可以看图、听声音、说话啦!

    美东时间9月25日,OpenAI在官网宣布,对ChatGPT进行重磅升级实现看图、听声音、输出语音内容三大功能。早在今年3月OpenAI发布GPT-4模型时,就展示过看图的功能,但由于安全、功能不完善等原因一直没有开放。BeMyEyes将ChatGPT的看图功能,植入在应用中,为盲人和弱视群体提供服务。

  • 开了眼的ChatGPT真让人开了眼了

    给自己放个假吧ChatGPT,再更新的这么快,网友的脑洞可就跟不上了。ChatGPT宣布了一次重要更新,然后有了全面的多模态能力。

  • unisim:可交互的真实世界AI模拟器 提供仿真体验

    unisim是一款创新的互动模拟器,经过生成模型的训练,可以以连贯的方式模拟对人类、机器人和其他互动代理进行的动作,并为它们提供仿真体验。这一技术代表了生成模型的下一个重要里程碑,可以用于从游戏和电影中的可控内容创建,到在仿真中训练直接在真实世界中部署的实体代理。UniSim代表了生成模型领域的创新,为互动模拟提供了有力的工具。

  • 随着无人机交通量增加,研究者利用AI帮助避免碰撞

    随着无人机的商业化应用不断增加,未来几年400英尺以下低空区域的无人机交通量预计会大幅增长。到2027年美国将拥有近100万架商业无人机系统,用于快递送货、交通监控以及应急救援等任务。随着商业无人机的快速发展,利用AI和模拟为其交通管理提供决策支持,实现无人机系统的高效安全运作,是当前研究的重要方向。

今日大家都在搜的词: