首页 > 业界 > 关键词  > 正文

Suno推出生成式音频AI基础模型 输入文本即可生成30秒音乐

2023-08-10 16:34 · 稿源:站长之家

站长之家(ChinaZ.com)8月10日 消息:最近,科技公司Suno推出了一款生成式音频AI基础模型,用户只需简单的文本输入,就可以生成两段约30秒带有歌词的音乐。这个玩法跟之前的Midjourney很相似,在Suno的Discord频道里输入“/ chirp”命令,再加上提示词,告诉它你想要的音乐风格和歌词即可。官方建议输入的内容不要超过4-8行。

image.png

体验地址:https://discord.com/invite/QRrnYufqZV

据报道,Suno是一家以研究为驱动的人工智能公司,致力于赋予创作者生成逼真音乐、语音和音效的能力。通过使用Suno AI,用户可以快速生成逼真的语音片段,为广告、动画、游戏等提供个性化的语音效果。Suno AI可以根据用户的需求生成各种音效,为电影、视频和音频项目增添更多创意和情感。这使得创作者能够更轻松地打造出富有个性和感染力的作品。

image.png

这款新的生成式音频AI基础模型为用户提供了一个便捷的工具,让他们能够以独特而创新的方式创作音乐。通过简单的文本输入,就能得到令人惊喜的音乐作品。Suno的新技术为创作人员提供了更多的创作灵感和可能性,让他们能够以更有趣、更出色的方式表达自己的创意。

举报

  • 相关推荐
  • 小米开源首个原生端到端语音大模型 支持音频重建任务和音频转文本任务

    小米发布首款开源端到端语音大模型Xiaomi-MiMo-Audio,拥有12亿参数,在智能性、情感表达和交互适配方面接近人类水平。该模型最大技术突破在于少样本学习能力,通过创新预训练架构和超一亿小时训练数据,成功突破传统语音模型依赖大规模标注数据的技术瓶颈。基于Transformer架构,支持音频重建和音频转文本等多任务处理。小米已在Huggingface平台发布预训练和指令微调版本,并在Github开源Tokenizer模型,为研究者和开发者提供完整工具链。

  • 视觉中国「灵感拓展」功能完成生成式AI服务上线登记

    视觉中国旗下中华易美视觉科技公司推出的“灵感拓展”功能已通过江苏省网信办生成式人工智能服务上线登记,正式在VCG.com面向用户开放。该功能基于国产大模型,结合丰富内容资源,通过AI技术为创作者提供灵感和方向,提升创意产出效率与质量。用户可在搜索时获得智能拆解的多维度创作建议,帮助精准定位需求,突破创作瓶颈,优化素材匹配效率。该功能是视觉中国在“AI智能+内容数据+应用场景”战略下的重要成果,目前已面向合作客户开放。

  • AI日报:小米开源首个原生端到端语音大模型;通义万相Wan2.2-Animate正式开源;Suno v5即将上线

    AI日报今日聚焦多项技术突破:小米开源首个端到端语音大模型Xiaomi-MiMo-Audio;通义万相推出全新动作生成模型Wan2.2-Animate;Suno即将发布革命性音乐模型v5;生数科技获数亿融资,视频生成技术商业化加速。同时关注OpenAI修复ChatGPT安全漏洞,谷歌将Gemini集成至Chrome浏览器,Luma AI发布支持16位色的Ray3视频生成模型,法国Mistral推出开源推理模型Magistral Small 1.2,Notion发布AI智能体,腾讯混元3D Studio提升3D创作效率。

  • DNS.COM重磅发布全球化基础设施安全服务战略 开创❝一站式安全❞基础设施新纪元

    知名网络基础设施服务商DNS.COM今日宣布战略调整,定位升级为“全球化一站式基础设施安全服务商”。此次转型标志着公司从传统DNS服务向综合性安全服务迈进,创新提出“一站式安全”架构,将安全能力深度融入DNS解析、云计算等基础设施层面。新战略以智能DNS解析、全球安全节点部署、专业服务保障为三大支柱,通过AI驱动技术提升威胁防护能力,最高支持6T级DDoS防护。公司计划2026年前在全球部署超100个安全节点,助力企业降低安全管理成本,推动行业向主动安全治理演进。这一调整有望为数字化转型中的企业提供更高效、全面的安全解决方案。

  • 没想到,音频大模型开源最彻底的,居然是小红书

    不难发现,近几个月,开源频频成为 AI 社区热议的焦点。尤其是对于国内科技公司来说,开源成为主旋律。根据 Hugging Face 中文 AI 模型与资源社区的数据显示,国内厂商在七八月接连开源33款、31款各类型大模型。 这些开源成果大多落在了文本、图像、视频、推理、智能体以及世界模型领域,而音频生成占比很小。

  • 飞猪AI“问一问”新功能:拍文物即可听讲解

    飞猪AI“问一问”推出拍照讲解功能,用户拍摄博物馆展品或建筑即可获得专业语音讲解。该功能依托文博旅游领域垂类数据,能精准识别文物细节并提供深入讲解,模拟专业导游风格。目前已向部分用户开放,预计近期全面上线,国庆中秋假期将为游客提供免费智能导览体验。

  • 破解 AI “安全与性能” 难题!DeepSeek-R1-Safe 基础大模型在华为全联接大会2025正式发布

    9月18日,华为全联接大会2025在上海开幕。会上,华为与浙江大学联合发布国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型。该模型在安全防护能力上表现突出,对有害言论、敏感内容等14个维度的防御成功率近100%,同时通用能力测试性能损耗控制在1%以内。双方表示将继续深化合作,推动AI安全技术与产业生态协同发展,为我国人工智能高质量发展提供支撑。

  • AI日报:快手推出AI视频制作助手Kwali;字节跳动推出USO模型;OpenAI推出ChatGPT开发者模式

    本文介绍了AI日报栏目,聚焦AI领域最新动态。快手推出Kwali视频助手,简化视频制作流程;字节跳动发布USO模型,解决图像生成中风格与主题的矛盾;微软推出Copilot Audio音频模式,提供个性化语音交互;Stability AI升级Stable Audio 2.5,支持高质量音频生成;阿联酋推出开源大模型K2 Think,拥有320亿参数;微信上线智能回复功能,提升公众号运营效率;OpenAI推出ChatGPT开发者模式,支持AI控制外部工具;字节跳动Seed团队发布AgentGym-RL框架,提升语言模型决策能力;月之暗面开源Checkpoint Engine中间件,优化LLM推理效率;B站开源IndexTTS-2.0文本转语音系统,支持情感与时长控制;Replit推出Agent 3编程助手,自主性提升10倍。

  • 基于通义万相 美图多款APP上线全新动漫特效、AI变身等视频生成功能

    今日,美图公司旗下美图秀秀、RoboNeo、Wink和开拍等多款产品,推出全新动漫特效、AI变身等视频生成功能。 据悉,新功能基于通义万相系列模型进行深度开发与训练,为美图的全球用户提供全新的创作体验。 近年来,美图加速布局生产力场景,不仅推出面向企业的AI算法服务和解决方案,旗下消费级产品也在快速集成大模型。 去年6月,美图就开始和阿里展开大模型合作。

  • AI日报:腾讯发布混元3D 3.0模型;昆仑万维上线Agent Studio功能;阿里Qoder推出付费订阅服务

    AI日报汇总最新行业动态:腾讯发布混元3D+3.0模型,建模精度提升3倍;昆仑万维Mureka上线音乐创作功能;阿里Qoder推出付费订阅服务;VEED Fabric 1.0实现图片转视频;OpenAI发布GPT-5-Codex革新编程;全国发布AI安全治理框架2.0;Mini-o3实现超长视觉推理;上海AI Lab推出多模态模型Lumina-DiMOO;腾讯微调技术提升图像美感300%;Meta推出轻量级MobileLLM-R1;腾讯启动AI应用繁荣计划;谷歌DeepMind�

今日大家都在搜的词: