想唱就唱！标贝科技高保真歌唱合成方案上线

2023-11-06 16:08 · 稿源：站长之家用户

随着AI技术的成熟，AI能力已慢慢渗透进音乐产业的诸多方面。特别是在ChatGPT爆火后，越来越多的生成式AI工具被快速推出，AI也全面展示了自身在作词、编曲、伴奏、演唱方面的创作能力。

例如，去年出现的开源AI翻唱项目Diffsvc和So-vits，从出现到发展至普通人难以辨别的地步，只用了几个月时间。今年初，谷歌也宣布开发了一款名为MusicLM的工具，可以实现从文本直接生成音乐。AI在音乐领域能发挥的作用越来越多。

歌唱合成

歌唱合成是将乐谱信息和歌词转换为歌唱语音的技术。由于音乐是流媒体，相较于语音合成，歌唱合成对作品的流畅度要求更高，需要保证作品的连续性和情感的起伏。

为了实现这一目标，歌唱合成技术需要输入更多维度的音乐标注信息，如音高、音符的时值等，同时还要求输出的歌声更有感情的变化，具有欣赏性。因此，技术实现上来说更为复杂。

随着目前AI语音技术的发展，歌唱合成技术也在不断进步，基于神经网络的歌唱合成模型已经可以按照乐谱信息合成完整的歌声。然而，合成歌声的表现力和真人演唱的录音相比仍有明显差距。

真人在唱歌时，可以根据歌词的语义，加入情绪和力度等各种细节变化，以增强歌声的感染力和表现力。而一般歌声合成软件虽然能够输出较为准确的歌声，但是因为无法理解歌词中所蕴含的语义信息，导致最终合成的歌声缺乏情感表现力。同时，由于歌曲相对于语音的变化范围更大，如何建模以合成更稳定的歌声，也是高表现力歌声合成的一大难题。

标贝科技歌唱合成方案

近日，标贝科技基于TTS4. 0 全新的高音质合成系统，上线高保真歌唱合成技术方案。依托于领先的深度学习技术和多情感风格大语言模型，让AI模型具备真人独特的音色、歌唱技巧和情感表现力，生成的歌声更加流畅、真实、细腻，达到媲美真人的演唱效果。

标贝科技的歌声合成模型是基于神经网络的声学模型和声码器两部分组成，二者均采用了生成对抗网络的结构，来增加对歌声信息的还原度。歌声声学模型除了预测mel谱以外，也会预测基频和清音/浊音符号，这些信息和mel谱一起送入声码器来辅助波形恢复。

为了保证生成的mel谱尽可能的还原歌声声音特点，我们的声学模型在采用生成对抗训练方式之外，还使用了多尺度判别器组合的结构，从不同粒度来优化频谱细节。

得到mel频谱后，将其与基频和清音/浊音一起送入声码器来恢复音频。同时，由于歌声的音高和发音持续时间波动较大，我们通过增大生成器和判别器的感受野来捕获更多的信息，其次引入一个额外的基于多尺度STFT(短时傅里叶变换)损失函数来，来获得更稳定和精细的波形。

目前，标贝科技歌唱合成方案可以支持用户自由填词，然后选择喜欢的音色，和预置的旋律进行智能匹配，完成歌曲合成。将操作歌曲创作的输入过程尽可能简化，并在合成效率和效果方面有了显著改善，用户一键即可体验短视频填词成曲的玩梗乐趣，适用于短视频、广告配音、社交娱乐等各种场景，并已经商业化落地。

歌唱合成推动了语音技术和音乐的进一步融合，更是拓展了音乐创作形式的多元化。帮助音乐人提高创作效率，同时也让非专业人士通过简单的操作就能拥有自己的音乐作品，极大地推动音乐的普及化和大众化。未来，随着语音技术的迭代发展，标贝科技也将持续完善产品服务能力，为客户提供更多个性化语音解决方案。

（推广）

特别声明：以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布，本平台仅提供信息存储服务，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任，相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述法律文件后，将会依法依规核实信息，沟通删除相关内容或断开相关链接。

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
标贝科技亮相Create 2024百度AI开发者大会

Create2024百度AI开发者大会在深圳国际会展中心盛大开幕。本次大会以“创造未来”为主题，设置了深度论坛、AI公开课、AI互动体验区、开发者之夜等精彩环节，汇聚了国内知名AI企业以及近万名海内外顶尖开发者与业界领袖，打造了一场备受瞩目的科技盛宴。随着AI技术的进一步发展，标贝科技也将继续发挥在智能语音领域的技术研发和产业化应用优势，持续丰富和优化产品、服务，实现低门槛、高效率、批量化的内容生成能力，广泛服务于各类内容的相关场景及生产者，为产业数智化升级和高质量发展提供持久的驱动力。
荐小游戏出海，跑出日本最赚钱的合成游戏

出海小游戏《肥鹅健身房》2月27日登陆日本，当日登顶日本iOS下载总榜。时隔近一个月后我们再来看这款游戏，下载排名依旧稳定在下载总榜Top30，累计下载量63w次，尤其让人惊喜的是畅销榜排名的变动，3月25日位列iOS游戏畅销榜Top87，将《MergeMansion》、《SeasideEscape》等的明星产品都甩到身后。根据data.ai信息，青瓷游戏获授权发行的塔防游戏《TotemvsBOT》以及肉鸽动作游戏《骑�

游戏
MoA：用于图片合成的混合注意力架构可实现风格参考和人物融合

在最新的研究中，提出了一种名为注意力混合模式的新架构，旨在个性化文本到图像扩散模型，可以实现风格参考和人物融合的效果。受大型语言模型中使用的专家混合机制的启发，MoA通过将生成工作负载分配给两个注意力路径来实现给定主题和背景的分离生成。这些应用展示了MoA在个性化图像生成领域的潜在价值和广泛适用性。

MoA AI头条
亮眼！今天聚衣堂的这场瑜伽服走秀尽显校企合作产教融合成果

4月12日，首届“聚衣堂杯”新锐设计师大赛决赛暨义乌工商职业技术学院产教融合成果展在浙江省浦江县体育中心隆重举行。现场来自全国数十所院校的创意设计专业师生同台展演瑜伽服创意设计作品，并吸引全国300多家服装供应商，行业专家、院校领导、学生代表、企业代表和社会各界人士等共2200多人参加活动。感谢义乌工商学院、常熟理工学院、浙江科技大学、浙江理工�

设计师大赛产教融合创意设计
EVI正式发布API 提供转录、语音合成服务

EVI，一款可以识别对话客户情感的人工智能，正式发布了API。自发布以来，它已经生成了大约10万次的对话，平均每次对话时长为10分钟，总计产生了超过300万条消息。EVIAPI的发布，使得AI的对话更加自然、个性化，同时也提供了更多的选择和便利，为用户带来了更好的体验。

EVI AI头条
打造高品质“文旅生态圈”！itc保伦股份智慧文旅音视频整体解决方案重磅上线！

2024年，文旅市场持续“沸腾”，从美丽“冻人”的“尔滨”到让人辣上瘾的“天水麻辣烫”，给当地文旅产业带来巨大经济效益。各地文旅为何持续火爆?“流量”如何变“留量”?itc为你解构文旅发展新思路。春潮涌动、活力迸发!当前我国文旅市场表现火热，发展潜力、规模和质量仍有提升空间。
IBM申请名为 “LAB” 的专利，利用合成数据训练LLM

IBM近日申请了一项名为“LAB”的专利，旨在利用合成数据来训练LLM模型，以加速企业AI技术的发展。AI模型对数据有着巨大的需求提供大量、质量高、相关性强的数据常常成为一项挑战。IBM可能会利用这一专利来支持那些正在构建自己AI模型的企业，提供一种相对于收集真实用户数据言更少资源密集的方法。

IBM LLM AI头条
OpenAI公开语音合成引擎Voice Engine：支持语音克隆，未开放使用

OpenAI近日分享了一个名为VoiceEngine语音合成模型的初步结果。VoiceEngine支持语音克隆，但是未开放使用，提供给了HeyGen等公司使用。OpenAI希望通过与各方合作，加强社会对合成语音技术带来的挑战的防范，促进对合成语音技术的了解和应用。

VoiceEngine OpenAI AI头条
Domo AI推视频色度抠图功能可将扣出的人物合成到新背景中

DomoAI近日推出了一项新功能，用户现在可以通过“--key”命令扣出主体人物后更换对应颜色的背景。这一功能的引入，无疑为用户带来了更多的便利和创作空间。DomoAI的这一新功能，无疑为用户提供了更多的创作自由度，使得视频和移动创作变得更加便捷和个性化。

Domo AI头条
新华社快看圆桌会聊房产：房产经纪和房产主播融合成发展趋势

2024年政府工作报告中强调适应新型城镇化发展趋势和房地产市场供求关系变化，加速构建房地产发展新模式的重要性。近期，新华社快看发起“房地产发展新模式，对消费者意味着什么”直播圆桌会，邀请原国家房改课题组组长、中房集团原董事长孟晓苏和北京房地产中介行业协会秘书长赵庆祥、快手理想家大区业务负责人边丽，以及贝壳找房哈尔滨合作商德佑房产主播@包大

房地产发展城镇化政府工作报告

今日大家都在搜的词：

热文

3 天
7天

想唱就唱！标贝科技高保真歌唱合成方案上线

今日大家都在搜的词：

热文

站长商机