以假乱真，天工音乐大模型带来颠覆式AI体验

2024-04-03 10:31 · 稿源：站长之家用户

昨日，昆仑万维AI音乐生成大模型「天工SkyMusic」开启了免费邀测活动，诚邀媒体、行业专家以及感兴趣的音乐从业者们共同体验人声情感表达 SOTA 的音乐大模型产品。

邀测开始后，广大用户对「天工SkyMusic」AI音乐生成大模型的热情远超我们的预期，工作人员在极短时间内收到了几十万份测试申请，其中包括众多专业的音乐创作人、媒体及行业专家，还有大量测试申请被源源不断地发至后台。

同时，我们也收到了大量来自用户的真实反馈与高度评价:

“人声很清晰抒情旋律也好”

“好听!”

“这是天工做的??太厉害了!”

“《悟空》这首歌是演唱气息感的，感情很到位，基本上代表了生成情感以假乱真的能力巅峰之作”

“天工SkyMusic在高音演唱技巧上超出我的想象，非常优秀。”

“太强了，1、AI音乐用户群体非常大;2、生成的音乐可以反复使用;3、很容易做社交裂变”

“副歌部分真丝滑，Beat真好”

“没想到中国团队做的东西比国外的好”

广大用户的热情反馈既然让我们看到了行业对于「天工SkyMusic」AI音乐生成大模型的高度期待，也让我们看到了在以“智力”为主的AGI大模型探索方向中，“情感AGI”的重要意义。

相比文本和图片，音频内容是理解人类情感最好的方式，而音乐又是人类情感表达最充沛、最不受地域和文化限制的内容载体，不论时代变幻，不论是战争还是灾祸，人们总是能通过音乐传递自己的感受并获得情感的慰藉。这是「天工SkyMusic」的创作初衷，也是昆仑万维情感AGI持续探索的重要方向。

我们感谢所有积极参与并热情反馈的用户们，感谢你们的支持、鼓励与陪伴，我们将持续迭代、优化、拓宽「天工SkyMusic」的能力边界，让模型具备更强的多模态情感理解与表达能力，为用户带来更优质的AI音乐体验。

最后，我们将很快给出「天工SkyMusic」音乐创作Prompt指南，并提供更多的AI音乐Demo与使用技巧，与用户一同探索AI音乐的强大魅力!

关于「天工SkyMusic」与「天工3.0」

「天工SkyMusic」AI音乐生成大模型基于昆仑万维「天工3.0」超级大模型打造。4月17日，「天工SkyMusic」将随「天工3.0」同步开启公测。

申请网页:https://rg975ojk5z.feishu.cn/share/base/form/shrcnTcBRpGzv5Sx9xAGd5V97Md

「天工3.0」采用4千亿级参数MoE混合专家模型，并将同步选择开源，是全球模型参数最大、性能最强的MoE模型之一。相较于上一代「天工2.0」MoE大模型，「天工3.0」在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升，其模型技术知识能力提升超过20%，数学/推理/代码/文创能力提升超过30%。同时，「天工3.0」新增了搜索增强、研究模式、调用代码及绘制图表、多次调用联网搜索等能力，并针对性地训练了模型的Agent能力，使得「天工3.0」能够独立完成规划、调用、组合外部工具及信息，以精准高效地完成产业分析、产品对比等各类复杂需求，带来全新的颠覆式人工智能体验。

「天工SkyMusic」是目前国内首款且唯一公开可用的AI音乐生成大模型，其采用音乐音频领域类Sora模型架构，Large-scale Transformer 负责谱曲，来学习 Music Patches 的上下文依赖关系，同时完成音乐可控性;Diffusion Transformer 负责演唱，通过LDM让Music Patches被还原成高质量音频，使得「天工SkyMusic」能够支持生成80秒44100Hz 采样率双声道立体声歌曲。这套模型架构在处理视频、音频和音乐领域效果极佳。昆仑万维团队也将在后续逐步迭代和添加新的能力，让模型具备多模态的情感理解与表达能力。

「天工SkyMusic」测试申请网页:https://rg975ojk5z.feishu.cn/share/base/form/shrcnTcBRpGzv5Sx9xAGd5V97Md

「天工SkyMusic」具有以下五大特点:

1. 高质量AI音乐

「天工SkyMusic」能够生成80秒44100Hz采样率双声道立体声AI歌曲，并可根据用户输入的歌词风格生成对应歌曲风格。

2. 人声“以假乱真”

人声合成是AI音乐生成中最重要、最能体现生成效果和品质的维度。「天工SkyMusic」的AI人声合成能够达到业内顶尖的SOTA水平，中文水平极为优秀，发音清晰、无异响。其中文演唱效果更是显著好于国外产品，领先世界水平。

3. 歌词段落控制

「天工SkyMusic」能够通过歌词来控制歌曲，让生成的歌曲可以明确分辨出不同歌词段落的情绪变化，体现出主歌和副歌、前奏和主歌的段落差异。

4. 多种音乐风格

「天工SkyMusic」支持说唱、民谣、放克、古风、电子等多种音乐风格，用户在创作音乐时，可以通过参考音频制定想要的音乐风格。

5. 音乐智能表达 - 歌唱技巧学习

「天工SkyMusic」同时能够学习如颤音、歌剧、吟唱、男女对唱，自动和声等多种歌唱技巧，让用户创作的歌曲得到更恰当的情感表达。

2023年，昆仑万维在 “All in AGI 和 AIGC” 的战略推动下，在人工智能领域取得了许多进展，逐步形成了AI大模型、AI搜索、AI音乐、AI动漫、AI 社交、AI游戏等AI业务矩阵。

当前，昆仑万维已打造了集AI搜索、AI写作、AI长文本阅读、AI对话、AI语音合成、AI图片生成、AI漫画创作、AI图片识别、AI音乐生成、AI代码写作、AI表格生成等多项能力于一体的「天工3.0」多模态“超级模型”（Super Model），成为AI行业全新里程碑。

（推广）

特别声明：以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布，本平台仅提供信息存储服务，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任，相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述法律文件后，将会依法依规核实信息，沟通删除相关内容或断开相关链接。

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
Soul探索AI社交，让用户社交体验颠覆式迭代

Z世代作为伴随互联网发展成长起来的一代人，通过互联网向内获取信息、知识，向外输出自我想法，彰显个性，已经成为他们的日常。Z世代对社交产品的要求也越来越高，他们需要更多样化的表达方式和个性化的功能，以满足独特的社交需求。Soul仍将继续探索AI技术在社交领域的应用，致力于让AI更好地介入关系的发现、破冰、沉淀等环节，提升关系建立的质量和效率，同时通过AI技术，构建人机交互的新场景，实现AI原生社交场景创新。
科沃斯机器人大模型算法通过备案，AI大模型与智能清洁结合带来哪些超级体验？

据吴中区政府公众号吴中发布报道，科沃斯家用机器人有限公司研发的科沃斯机器人大模型算法成功通过国家网信办深度合成服务算法备案，这也是国内家用机器人领域首个通过国家备案的大模型算法。该模型作为国内首个在家用机器人领域中通过国家备案的大模型算法，其应用场景包括智能家用机器人的自主决策、智能客服系统的高效问答等。具体而言，该大模型支持将用
对话腾讯汤道生：AI不止于大模型

过去1年，腾讯集团高层间，新增了一个重要的企业微信群聊。腾讯公司董事会主席兼CEO马化腾、总裁刘炽平、高级执行副总裁卢山和汤道生等，悉数进入该群。面对不确定，有些人不喜欢或不愿意，但你永远应该对它保持敬畏。

腾讯集团企业微信群聊大模型技术变革
国内首批！华为云盘古汽车大模型通过可信AI汽车大模型评估

快科技7月11日消息，近日在信通院组织的可信AI汽车大模型首轮评估中，华为云盘古汽车大模型顺利完成了评估，获得4 级证书，成为国内首批通过该项评估并获得当前最高评级的行业大模型。据悉，华为云盘古汽车大模型在2023年的全联接大会首次发布，覆盖了汽车设计、生产、营销、研发等业务场景。上个月，华为开发者大会2024上又发布了全新升级的盘古大模型5.0，重塑自动驾驶的开发，通过技术创新，更好的理解世界，生成自动驾驶训练视频。华为表示，盘古汽车大模型过去一年持续深耕行业，已覆盖汽车业务超20多个L2场景，并已深入到汽车生产、

可信AI 汽车大模型华为云盘古
荐绕晕了！9.11 大还是 9.9 大，难倒一批 AI 大模型？

「9.11和9.9，哪个大?」对于不少习惯了更新软件版本号的程序员言，不少人的第一反应就是:当然是9.11大。但是如果没有限定场景，只是单纯地提出上面这个问题时，结果必然是相反的。大模型如今在基础能力方面的表现，也不禁让人想到就在几天前，GoogleDeepMindCEODemisHassabis在公开场合表示，“当前的AI在智力方面与猫的水平相当，甚至还不如普通家猫”，这无疑给许多期待AGI�

人工智能大模型软件版本
荐谁才是大模型“四小龙”？

这两年热闹的大模型创业潮，被业内称为“AI2.0”。与之对应的“AI1.0”，指的是2015年左右开始的那一波AI创业潮，当时诞生了商汤、旷视、云从、依图等明星创业公司，它们以CV技术为主导，大量融资，风头无两。它们面对的挑战，丝毫不比“AI四小龙”小。

大模型
这个汇聚了全球顶级AI大模型应用和工具的网站，真是一个AI便利超市

速读:分享一个汇集了所有AI大模型的实用网站。前天从阮一峰的《科技爱好者周刊》中发现一个不错的网站，号称“汇集全球顶级品牌的AI超市，无月费、按需付费、全面开放”，口号还挺大。使用时请注意个人信息安全。
国产AI大模型Kolors：ComfyUI平台部署指南

在AI技术的浪潮中，快手公司推出的文生图大模型——Kolors，以其卓越的性能和开源精神，成为国产AI技术的一颗璀璨新星。Kolors不仅在图像生成效果上超越了现有的开源模型，更达到了与商业闭源模型相媲美的水平，迅速在社交媒体上引发热议。随着越来越多的企业和开发者加入Kolors的开源生态，我们有理由相信，这将为整个行业带来新的发展机遇。

Kolors ComfyUI AI会员教程
荐提示词用上“过去式“，秒破GPT4o等六大模型安全限制！中文语境也好使

只要在提示词中把时间设定成过去，就能轻松突破大模型的安全防线。且对GPT-4o尤其有效，原本只有1%的攻击成功率直接飙到88%，几乎是“有求必应”。这样的结果也说明，如果能够对潜在的攻击进行准确预判，并使用拒绝示例让模型对齐，就能有效对攻击做出防御，也就意味着在评估语言模型的安全性和对齐质量时，需要设计更全面、更细致的方案。

提示词 GPT4o 人工智能
荐大模型的招投标订单都被谁拿走了？

大模型技术席卷全球科技界，中国也迅速跟进这一浪潮，在诸多领域开始落地，提升了企业运营效率和消费者体验。大模型企业也面临技术成熟度、成本、数据安全、行业差异、用户接受度等挑战，商业化仍然是一个摆在所有厂商面前的问题。在可预期的未来，大模型技术将在更多领域发挥作用，在这个技术、市场和商业模式等维度都快速变迁的行业，未来的走向还需要拭目�

大模型技术企业运营效率消费者体验

知了zKnown:致力于信息降噪 / 阅读提效的个人知识助手

知了 zKnown 是一款 AI-Native 构建的个人知识助手，专注于信息降噪和阅读提效。它通过多端同步、多渠道总结、长文本支持等功能，帮助用户高效地管理和整理信息。产品的主要优点包括：- 多端同步：用户可以在移动app、桌面客户端、网页版、小程序等多个平台同步使用。- 多渠道总结：支持微信公众号、知乎、简书、36Kr、少数派等多个渠道的文章总结。- 长文本支持：最长支持总结3万字的文章内容。- 摘要导出：用户可以将摘要保存到 Notion、Flomo 等平台。- 产品背景：知了 zKnown 致力于通过 AI 技术提升用户的阅读和信息管理效率，适合需要高效处理大量信息的用户。

信息管理阅读提效 AI助手

MBox AI Meet:实时转录与会议总结的谷歌会议扩展

MBox AI Meet是一款免费Chrome扩展，专为Google Meet设计，提供实时转录和自动生成会议总结的功能。它利用AI技术帮助用户在会议中专注于讨论，而无需担心记笔记。该工具通过实时转录捕捉会议的每一个细节，并在会议结束后自动生成总结，确保用户不会错过任何重要信息。MBox AI Meet的隐私优先策略确保会议安全，不存储任何音频或视频内容。此外，该扩展还计划在未来更新中增加更多AI功能，如发言人识别、实时AI助手等。

AI 会议管理实时转录

Klee:本地安全AI，保障数据隐私。

Klee是一款macOS原生的AI助手应用程序，专注于本地处理数据，确保数据安全和隐私。它使用先进的AI技术，如RAG（检索增强生成）和开源大型语言模型，如Llama 3和Mistral，为用户提供高效、智能的笔记、搜索和知识管理功能。Klee的主要优点包括本地运行以保护隐私、支持团队协作、免费使用以及优化的macOS体验。

AI助手 macOS原生数据隐私

Kipps.AI:快速构建AI助手，提升业务效率

Kipps.AI 是一个在线平台，允许用户在短短两分钟内构建自己的AI助手，并将其集成到业务中。该平台支持多种数据源，如PDF、Notion、网站链接和文本，用户只需提供这些数据，Kipps.AI 会处理其余部分。它还与常用的工具如GoDaddy、Wordpress、Drupal、Squarespace、Magento和Wix等进行集成，使得用户可以轻松地将AI助手集成到现有的业务流程中。

AI助手自动化数据处理

CrossPrism for MacOS:图像识别、标注和关键词生成工具

CrossPrism for MacOS 是一款专为摄影师设计的图像识别、标注和关键词生成工具。它利用多核 CPU、GPU 和神经引擎，能够识别物种、生成标题和描述，并支持模型训练的可定制性。用户可以在本地自动标注无限量的原始照片，确保所有照片安全地存储在 Mac 上，无需担心云服务中断、数据锁定或文件传输问题。其20多个专家模型可以对从鸟类到地标的各种内容进行分类，并提供新的视角来整理目录和重新发现旧照片。此外，它还支持视频处理、Lightroom 插件、图像质量评估等功能，使其成为一个强大的筛选工具。

图像识别照片管理 AI

ZETIC.ai:构建零成本的设备端AI。

ZETIC.ai提供了一种革命性的设备端AI解决方案，使用NPU技术帮助企业减少对GPU服务器和AI云服务的依赖，从而显著降低成本。它支持任何操作系统、任何处理器和任何目标设备，确保AI模型在转换过程中不损失任何核心功能，同时实现最优性能和最大能效。此外，它还增强了数据安全性，因为数据在设备内部处理，避免了外部泄露的风险。

设备端AI NPU 成本节约

Kerqu.Ai:一站式AI内容生成器，助力跨境电商提升效率。

Kerqu.Ai是一个为跨境电商卖家提供一站式AI解决方案的平台，整合了先进的AI技术，帮助用户节约成本、提升品牌影响力和销售转化率。产品通过AI技术实现模特换场景、AI图片创作、批量抠图、图片变高清等功能，同时提供一键撰写文案、优化文案和多语言翻译服务，满足多站点经营需求。

AI 跨境电商图像处理

ReviewHawk:通过分析用户评论，降低用户流失率。

ReviewHawk是一个专注于分析应用商店评论的工具，旨在帮助企业降低用户流失率，获取用户反馈，从而改善产品。它通过数据驱动的决策和用户满意度分析，帮助企业了解用户真正想要的功能，从而提升用户留存率和产品满意度。

用户反馈产品优化数据驱动

Airtable Cobuilder:快速创建与管理数据的应用程序

Airtable Cobuilder 是一款强大的应用程序构建工具，旨在通过简单的拖放界面和AI辅助功能，帮助用户快速创建和管理数据。它允许用户连接和简化他们最关键的数据，通过可视化数据、自定义视图和集成其他业务工具，提高团队协作和数据管理的效率。该工具特别适合需要高度定制化和灵活性的业务应用场景。

应用程序构建数据管理团队协作

Alertfor:追踪网络信息，及时获取答案变化

Alertfor 是一个在线平台，通过其专有的AQTA (Ask Question Track Answer) 流程，允许用户提交复杂问题，并在网页上寻找最相关的答案。它通过持续追踪提供连续的更新，确保用户能够获得准确且及时的信息。

信息追踪自动更新网络查询

Unskool:家长支持工具，助力家庭教育

Unskool是一个由家长为家长制作的辅助工具，旨在简化家庭教育过程。它通过去除繁琐的行政工作，让家长能够专注于创造一个丰富的学习环境，让家长和孩子都能茁壮成长。Unskool提供了跟踪、记录和灵感激发的功能，并通过人工智能生成定制的、按需的课程计划，帮助家长更高效地进行家庭教育。

家庭教育学习跟踪课程计划

AI Generated Diagram:智能生成图表工具

AI Generated Diagram 是一款利用人工智能技术生成图表的工具。它通过用户输入的提示（prompts）来创建图表，支持多种布局类型，如水平布局（Horizontal）。用户可以通过编辑、配置等操作来调整图表的细节，并支持导出为SVG格式或导出数据。该工具不仅提高了设计图表的效率，还通过AI技术提升了图表的美观度和准确性。

AI 图表生成数据可视化

Free AI Image Extender:使用人工智能扩展图像边界

AI Image Extender 是一款利用人工智能技术扩展图像边界的工具，通过生成新内容与现有图像无缝融合，增强图像的视觉延展性。该产品通过先进的AI算法，能够智能识别图像内容并生成自然过渡的扩展区域，适用于需要图像扩展或背景生成的各种场景。

图像编辑 AI技术无缝扩展

Capacities:一个为你的思维打造工作室的APP

Capacities是一个旨在改善人们思考方式和工作流程的应用程序。它通过使用对象而非传统文件和文件夹来组织信息，帮助用户更直观地理解和连接复杂的信息结构。该应用支持网络化笔记，使用户能够自然地构建信息网络，激发新的创意。Capacities还提供AI助手，帮助用户与笔记中的对象动态互动，并提高写作质量。此外，该应用注重数据安全和隐私保护，符合GDPR标准，数据存储在欧盟的加密服务器上。

笔记 AI助手信息管理

CLASI:高质量、类人同声传译系统

CLASI是一个由字节跳动研究团队开发的高质量、类人同声传译系统。它通过新颖的数据驱动读写策略平衡翻译质量和延迟，采用多模态检索模块来增强特定领域术语的翻译，利用大型语言模型（LLMs）生成容错翻译，考虑输入音频、历史上下文和检索信息。在真实世界场景中，CLASI在中英和英中翻译方向上分别达到了81.3%和78.0%的有效信息比例（VIP），远超其他系统。

同声传译多语言人工智能

image-matting:AI抠图项目，使用开源模型实现图像抠图。

image-matting 是一个基于开源模型 briaai/RMBG-1.4 的AI抠图项目。该项目旨在通过学习AI技术、GUI开发、前端学习以及i18n国际化等技术，实现本地模型算法的图像抠图功能。它支持单张和批量抠图，用户可以通过拖拽和粘贴的方式快速进行图像处理。项目还提供了打包后的运行文件下载链接，方便用户使用。

AI 图像处理开源

OnlyPans:AI定制周晚餐计划

OnlyPans是一个利用人工智能技术为用户提供定制化晚餐计划的应用程序。它通过与用户的简短聊天来了解用户的预算、口味偏好、语言习惯、饮食限制以及日常生活的忙碌程度，然后快速生成符合用户需求的晚餐计划。随着用户使用时间的增长，OnlyPans会不断学习和优化，提供更加个性化的服务。此外，OnlyPans还提供智能购物清单功能，帮助用户避免食品浪费和不必要的紧急购物。OnlyPans注重用户隐私保护，承诺不会出售用户的任何信息。

AI 个性化健康饮食

Excel Dashboard AI:将Excel转换为仪表板和报告的AI工具。

Excel Dashboard AI是一款利用人工智能技术，将Excel数据快速转换为交互式仪表板和分析报告的工具。它通过自然语言处理能力，允许用户以对话形式与数据进行交流，从而迅速获得洞察。产品的主要优点包括快速生成多样化的数据分析维度、自然语言编辑和锁定分析视角、一键生成交互式仪表板、AI解读图表含义以及将仪表板转换为详尽的分析报告等。

数据分析 AI 自然语言处理

清影 AI 视频生成服务:基于 AI 技术生成视频内容的智能服务。

清影 AI 视频生成服务是一个创新的人工智能平台，旨在通过智能算法生成高质量的视频内容。该服务适合各种行业用户，能够快速便捷地生成富有创意的视觉内容。无论是商业广告、教育课程还是娱乐视频，清影 AI 都能提供优质的解决方案。该产品依托于先进的 GLM 大模型，确保生成内容的准确性与丰富性，同时满足用户个性化需求。提供免费试用，鼓励用户探索 AI 视频创作的无限可能。

AI 视频生成内容创作

Tempest AI:无需编码，10分钟构建游戏

Tempest AI是一个无需编码即可快速构建游戏的平台。它利用强大的AI助手帮助用户从零开始创建游戏，支持动态角色、适应性任务和互动世界。用户可以通过拖放编辑器构建世界，设计游戏机制，并通过故事构建器控制游戏叙事。Tempest AI不仅适合游戏开发者，也适合那些希望探索创意和互动叙事的爱好者。

以假乱真，天工音乐大模型带来颠覆式AI体验

今日大家都在搜的词：

热文

站长商机