首页 > 传媒 > 关键词  > 正文

喜马拉雅携自研语音技术成果亮相云栖大会,重现经典声音

2023-12-22 13:39 · 稿源: 站长之家用户

10 月 31 日, 2023 云栖大会在杭州云栖小镇正式开幕,喜马拉雅携自研语音技术成果亮相这一重要科技盛会,与全球科技、数字精英,共同探讨AI、云计算、大数据等新兴技术的未来发展趋势。大会之上,喜马拉雅带来了AIGC与文娱音频产业深度融合的最 新成果,展示出喜马拉雅在人工智能领域的长足进步。

在云栖大会现场,喜马拉雅展示了其自研的珠峰语音生成式大模型。该大模型是由喜马拉雅珠峰智人团队与西北工业大学aslp lab展开合作,基于自研框架,实现音频与文本在统一框架下的稠密训练,用于语音生成任务,能够实现语音风格和音色的 zero shot 的学习和迁移。借助喜马拉雅基于阿里云数据湖3. 0 构建的云原生大数据平台,创作者可利用该模型实现风格和音色的任意组合。

据喜马拉雅首席科学家、珠峰实验室负责人卢恒介绍,“喜马拉雅语音生成式大模型目前已经取得了显著的突破,在音色定制方面实现了 5 秒内的‘极速克隆’声音。通过极少量的数据,该模型能够克隆出具有90%相似度的基本音色,并在短短的 10 秒内快速生成定制音频。未来,这项技术在短视频创作、数字人配音、人机交互对话、名人IP复刻等领域有望发挥出巨大的潜在价值,有效解决商业场景中的沟通需求痛点。”

与珠峰语音生成式大模型共同惊艳展会的还有喜马拉雅AI儿童形象代言人“波波”。“波波”是借助喜马拉雅第二代智能语音交互系统生成的IP形象,“波波”具有连贯的对话能力,可为家庭亲子用户提供陪伴对话功能。

作为深受用户喜爱的在线音频平台,喜马拉雅一直坚持以科技赋能文化。近年来,喜马拉雅在AI语音技术领域取得卓越成就,成立的喜马拉雅珠峰实验室,专注于语音合成、语音识别、语音信号处理、编解码和智能音效的研究和开发。喜马拉雅已在多模态AIGC、软硬件结合等领域取得了丰富的成果。

此前,喜马拉雅珠峰实验室运用AIGC技术能还原已故的评书大师单田芳先生的声音,并使用他的AI合成声音来全新演绎经典之作。单田芳先生之子单瑞林对AIGC声音的表现给予了高度肯定。目前喜马拉雅平台上,借助AIGC制作的“单田芳声音重现”系列专辑,播放量已经超过 1 亿次,为听友朋友们重现经典声音,带来故事的全新演绎。

未来,喜马拉雅将继续探索人工智能、大数据等新兴技术,为用户提供更好的收听体验,同时提高创作者的内容生产效率,用技术为声音赋能,为生活添姿加彩。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看

今日大家都在搜的词: