首页 > 传媒 > 关键词  > 正文

喜马拉雅携自研语音技术成果亮相云栖大会,重现经典声音

2023-12-22 13:39 · 稿源: 站长之家用户

10 月 31 日, 2023 云栖大会在杭州云栖小镇正式开幕,喜马拉雅携自研语音技术成果亮相这一重要科技盛会,与全球科技、数字精英,共同探讨AI、云计算、大数据等新兴技术的未来发展趋势。大会之上,喜马拉雅带来了AIGC与文娱音频产业深度融合的最 新成果,展示出喜马拉雅在人工智能领域的长足进步。

在云栖大会现场,喜马拉雅展示了其自研的珠峰语音生成式大模型。该大模型是由喜马拉雅珠峰智人团队与西北工业大学aslp lab展开合作,基于自研框架,实现音频与文本在统一框架下的稠密训练,用于语音生成任务,能够实现语音风格和音色的 zero shot 的学习和迁移。借助喜马拉雅基于阿里云数据湖3. 0 构建的云原生大数据平台,创作者可利用该模型实现风格和音色的任意组合。

据喜马拉雅首席科学家、珠峰实验室负责人卢恒介绍,“喜马拉雅语音生成式大模型目前已经取得了显著的突破,在音色定制方面实现了 5 秒内的‘极速克隆’声音。通过极少量的数据,该模型能够克隆出具有90%相似度的基本音色,并在短短的 10 秒内快速生成定制音频。未来,这项技术在短视频创作、数字人配音、人机交互对话、名人IP复刻等领域有望发挥出巨大的潜在价值,有效解决商业场景中的沟通需求痛点。”

与珠峰语音生成式大模型共同惊艳展会的还有喜马拉雅AI儿童形象代言人“波波”。“波波”是借助喜马拉雅第二代智能语音交互系统生成的IP形象,“波波”具有连贯的对话能力,可为家庭亲子用户提供陪伴对话功能。

作为深受用户喜爱的在线音频平台,喜马拉雅一直坚持以科技赋能文化。近年来,喜马拉雅在AI语音技术领域取得卓越成就,成立的喜马拉雅珠峰实验室,专注于语音合成、语音识别、语音信号处理、编解码和智能音效的研究和开发。喜马拉雅已在多模态AIGC、软硬件结合等领域取得了丰富的成果。

此前,喜马拉雅珠峰实验室运用AIGC技术能还原已故的评书大师单田芳先生的声音,并使用他的AI合成声音来全新演绎经典之作。单田芳先生之子单瑞林对AIGC声音的表现给予了高度肯定。目前喜马拉雅平台上,借助AIGC制作的“单田芳声音重现”系列专辑,播放量已经超过 1 亿次,为听友朋友们重现经典声音,带来故事的全新演绎。

未来,喜马拉雅将继续探索人工智能、大数据等新兴技术,为用户提供更好的收听体验,同时提高创作者的内容生产效率,用技术为声音赋能,为生活添姿加彩。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • inne因你新品视立棒亮相2025国际眼科学学术会议,重磅发布临床成果

    第25届环球科学峰会聚焦全球科学前沿,吸引多国科学家参与,探讨视力健康与保护新方法。研究显示特定护眼产品能显著改善儿童视力及对比敏感度等指标,获专家高度评价。该成果基于严谨的临床试验,为学龄儿童视力保健提供创新解决方案。此外,与上海同济医院合作的研究也取得进展,表明特定护眼补充剂对青少年视力有益。

  • 以“无界安全”重构有限空间:ELEGRP益而益技术平台亮相2025AWE

    在 2025 年中国家电及消费电子博览会(AWE)上,ELEGRP益而益集团以“空间有限 安全无界为主题,系统性呈现其两大技术引擎——益而益PBE技术平台与益而益传感技术平台。通过“技术进化时间轴+场景化解决方案”的双线叙事,向全球观众展示了如何以安全为内核,突破物理空间限制,构筑家庭与工业场景的“电气&气体安全双屏障”,开启安全防护的下一代革命。益而益PBE技�

  • 乐橙亮相2025阿里AI势能大会,共探智能家居未来新范式

    4 月 9 日至 12 日,由阿里云主办的2025 AI势能大会在首创·郎园 Station 中央车站顺利举办,乐橙作为智能家居领域的创新先锋品牌应邀出席。乐橙此次特意携全新升级版本瓴洞视觉系统及创新家居生活理念重磅亮相,与行业专家、生态伙伴共同探讨AI技术如何赋能智能家居产业升级,推动“AI+安防”场景的深度融合。会议中,乐橙对外展示了自研全时守护算法Imou sense AI的实际应�

  • 智汇舟精彩亮相第27届中国高速公路信息化大会,引领智慧交通新风向

    3月27-28日,第27届中国高速公路信息化大会暨技术产品展示会在青岛红岛国际会议展览中心盛大举行。智汇云舟以“视频孪生智驭交通”为主题,携前沿技术、创新产品与卓越方案惊艳亮相,得到行业专家的一致认可与好评。智汇云舟将继续秉持创新精神,深耕智慧交通领域,为推动我国高速公路数字化建设、提升交通服务质量贡献更多力量。

  • 忆联亮相2025中国移动智算大会,携手行业伙伴共绘智算新蓝图

    4月10日,2025中国移动云智算大会在苏州金鸡湖国际会议中心盛大开幕,大会以"由云向智,共绘算网新生态"为主题,重磅发布了全新云智算体系、算力网络新底座、产业生态共创等多项计划与创新成果。忆联以中国移动战略合作伙伴身份重磅亮相展会,携新一代企业级PCIe5.0SSD及全场景存储解决方案惊艳登场,与行业技术专家及生态合作伙伴共探云计算与智能技术融合趋势,共绘存储产业转型升级发展蓝图。忆联将与中国移动携手并进,推动数据存储技术的创新发展,持续提供高性能、高可靠的存储底座,以坚实存力赋能新质生产力,共绘智算新蓝图。

  • SK海力士1cnm DRAM技术成果:良品率提升至80%以上

    据报道,SK海力士在DRAM芯片技术领域取得重大突破,其1cnm工艺DRAM芯片良品率已从去年下半年的60%快速提升至80%-90%的行业领先水平。这一技术突破正值AI浪潮推动高性能存储需求激增的关键时期,有望帮助SK海力士在消费级和数据中心市场建立技术优势,挑战三星在DRAM领域的领导地位。随着良品率的持续提升和产能的逐步扩大,1cnmDRAM芯片有望重塑存储市场格局,为AI时代的数据处理需求提供更强大的支持。

  • B站喜马纷纷入局,年轻人需要“能看”的视频播客吗?

    B站近期积极布局视频播客领域,邀请《无聊斋》《故事FM》《忽左忽右》等头部播客节目入驻,并提供流量和现金激励。3月26日上线首档自制视频播客《一麦三连》,采用录音棚对谈形式,首期播放量超150万。喜马拉雅也推出视频播客《行走的思考》,累计播放589万次。目前国内视频播客可分为四类:圆桌对谈型(如《一麦三连》)、远程连线型(如TIANYU2FM)、动画型(如《菠萝油子》)和纪录片型(如《行走的思考》)。虽然视频播客制作成本高、周期长,但平台支持和广告主需求正推动创作者尝试。数据显示,美国30%播客听众通过YouTube收听,而国内用户对播客的认知仍以音频为主。头部播客多因平台政策推动视频化,中小创作者则更主动尝试。视频播客能否改变中文播客"小众"认知,带来新商业可能,仍需观察。(140字)

  • 噜咔博士国内首款养成系AI宠物惊艳亮相2025消博会

    4 月 13 日至 18 日,第五届中国国际消费品博览会(以下简称“消博会”)正在如火如荼进行中。在云天励飞展台,几只毛茸茸的仿真小狗正通过摇尾、点头、折耳等拟真动作回应观众的互动,成为现场一大焦点。这款由噜咔博士推出的国内首款养成系AI宠物用“真实宠物成长逻辑+人工智能技术”,再次拓展了AI伴身智能教育硬件的边界。模拟喂养:用养成让陪伴进阶噜咔博士AI宠物

  • 视源股份智慧生活方案亮相第137届广交会,希沃亲子屏等新品引关注

    第 137 届广交会现场。视源股份打造的智慧生活体验区成为人气最旺的展区之一。其中,新发布的 55 英寸的希沃亲子屏凭借"一机多用"的人性化设计成为全场焦点;衣物护理机则展示了热泵冷凝技术带来的专业护理体验。这些创新产品共同构建了覆盖生活全场景的智慧解决方案,展现了视源股份在智慧生活领域的技术实力。教育不应囿于校园围墙,家庭同样是培育未来的重要土

  • AI存储,不再小马拉大车

    3月末,多家海外存储头部企业,宣布从4月起提高部分产品报价,国内厂商也随之上调价格,终结了DRAM内存与NAND闪存的降价势头。多家厂商曾在近期表示,价格上涨速度高于此前预期。面对国产化替代的历史机遇,京东云云海于内前瞻布局高性能,于外积极互联互通,作为AI基础设施的创新参与者,京东云云海已经代表AI存力市场率先迈出了坚定的一步。