首页 > AI头条  > 正文

MiniMax发布Voice Design音色设计功能 可自定义无限组合

2025-06-23 09:35 · 来源: AIbase基地

稀宇科技(MiniMax)宣布其Speech-02语音模型在Artificial Analysis榜单中持续保持全球领先地位,并正式推出Voice Design音色设计功能。该功能允许用户通过自然语言描述生成个性化音色,实现“任意语言 × 任意口音 × 任意音色”的全自定义组合,进一步降低语音合成领域的技术门槛。

据稀宇科技介绍,Voice Design功能可精准控制音色的多个维度,包括音频质量、发声方式、情感基调及人物画像。用户仅需输入文本描述,模型即可自动拆解需求并生成对应的音色编码。例如,用户可描述“带有积极鼓励的AI助手,语调积极,韵律变化丰富”,或“严厉的AI助手,女声,语速较快,音色明亮”,系统将生成符合要求的语音。

微信截图_20250623093512.png

为验证功能效果,稀宇科技展示了多组音色示例:古代侠客的洪亮正直、悬疑故事播音员的低沉磁性、权威新闻女主播的清晰利落,以及充满活力的推销员语速等。这些示例展示了Voice Design在音色定制方面的灵活性,可满足不同场景的语音需求。

稀宇科技指出,Voice Design的推出解决了语音合成领域的两大挑战:一是传统音色库难以匹配细分场景的多样化需求,二是复刻音色存在版权风险且操作复杂。通过Voice Design,用户无需准备高质量输入素材,即可快速生成理想音色,并可存储用于后续音频创作。

目前,稀宇科技的两代Speech模型已累计生成超过1.5亿小时的语音,与全球超30个国家的客户达成合作。此次Voice Design功能的上线,标志着稀宇科技在语音技术领域的持续创新,并致力于为全球用户提供更便捷、高效的语音解决方案。

用户可通过稀宇科技国内版平台(minimaxi.com/audio)或海外版平台(minimax.io/audio)体验Voice Design功能,探索语音合成的无限可能。

  • 相关推荐
  • AI日报:月之暗面首款自主智能体Kimi-Researcher;MiniMax推音色设计功能;Jaaz发布Lovart AI本地化替代品

    【AI日报】今日AI领域重要动态:1)月之暗面发布Kimi-Researcher智能体,多轮搜索推理能力超越谷歌和OpenAI同类产品;2)MiniMax推出Voice Design功能,支持多语言/音色组合;3)火山引擎上线AI智能域名推荐功能;4)Anthropic强化VSCode集成;5)Google推出Gemini2.5Flash-Lite模型,可实时生成交互界面;6)苹果拟300亿美元收购AI公司Perplexity;7)月之暗面开源Kimi-2506多模态模型;8)Firecrawl将推出开源问答引擎Fireplexity;9)银河通用机器人获宁德时代10亿元融资;10)字节跳动发布DreamActor-H1视频生成系统;11)Google推出开源实时音乐生成模型Magenta RealTime;12)开源AI设计工具Jaaz发布。

  • AI日报:MiniMax发布视频智能体Hailuo Agent;昆仑万维开源 Skywork-SWE-32B;B站接入Qwen 3等模型

    本期AI日报聚焦多项AI领域创新:1)MiniMax推出视频Agent工具,支持文本生成高清视频及人脸驱动;2)昆仑万维开源Skywork-SWE-32B模型,提升软件工程任务表现;3)B站接入通义千问模型,推出数据分析智能体InsightAgent;4)ChatGPT深度整合Gmail与日历功能;5)腾讯云发布全链路AI开发平台"AI Builder";6)HeyGen推出UGC广告数字人功能;7)研究显示过度依赖AI或削弱批判性思维。此外还涵盖AI音乐生成、内容检测工具停运等动态,展现AI技术快速发展的多元应用与潜在影响。

  • MiniMax深夜开源首个推理模型M1,这次是真的卷到DeepSeek了。

    ​不知道还有多少人记得,AI行业的六小虎。 行业内都在说,他们已经寂静好久了。 上一次相关的项目发布,还是前一段时间我写的MiniMax声音模型的更新,Speech-02。 而昨晚凌晨将近12点的时候,又是MiniMax,居然在X上,预告了他们一整周的发布计划。

  • AI日报:MiniMax-M1开源;阿里Qwen3升级版适配苹果MLX架构;月之暗面发布新模型Kimi-Dev-72B

    《AI日报》汇总了近期AI领域多项重要进展:1)月之暗面推出开源编程模型Kimi-Dev-72B,在软件工程任务测试中创下新纪录;2)MiniMax开源M1模型,支持超长上下文推理且训练成本低;3)腾讯发布AI音乐模型LeVo,支持音色克隆和分轨生成;4)阿里云Qwen3升级版适配苹果MLX架构;5)豆包推出"AI播客"功能,可将PDF转为对话播客;6)夸克App上线个性化AI家教"夸克老师";7)松下发布多模态大模型OmniFlow,实现文本/图像/音频自由切换;8)TikTok推出三款AI视频创作工具;9)极氪与火山引擎合作,将豆包大模型接入智能座舱系统;10)Meta的Llama3.1模型在文本记忆方面表现突出;11)Grok上线定时追踪X热门话题功能;12)Gemini2.5Pro即将更新Deep Think功能;13)谷歌地图引入AI技术升级导航和个性化推荐功能。

  • AI日报:MiniMax推视频生成模型Hailuo 02;Cursor Pro取消500次请求限制;谷歌发布AI模型 Gemini 2.5 Flash-Lite

    本文汇总了AI领域最新动态:1)Cursor Pro取消500次请求限制;2)稀宇科技推出视频生成模型Hailuo02;3)谷歌发布轻量级AI模型Gemini2.5Flash-Lite;4)科大讯飞星火X1升级版7月上线;5)腾讯元宝推出AI编程模式;6)OpenAI将下架GPT-4.5 API;7)苹果Speech API转录速度超Whisper 55%;8)百度推出数字人互动直播间;9)Meta曾试图高薪挖角OpenAI人才;10)Krea1公测开放,解决"AI感"问题;11)特斯拉Grok车载AI助手即将上线;12)谷歌Gemini新增视频分析功能。

  • AI日报:阿里开源3D数字人项目MNN TaoAvatar;MiniMax Agent上线;罗永浩数字人直播再探“AI+IP”带货模式

    本文汇总了AI领域最新动态:1)阿里开源MNN+TaoAvatar技术,实现手机端3D数字人实时交互;2)MiniMax升级AI工具Agent,新增智能图像搜索和多语言支持;3)罗永浩数字人将登陆百度电商直播;4)OpenAI员工套现近30亿美元,软银成最大接盘方;5)ChatGPT推出深度研究和语音模式升级;6)Meta发布V-JEPA2模型,提升机器人环境适应能力;7)AMD与OpenAI合作推出新一代AI芯片;8)Google Gemini集成Imagen4图像生成模型;9)谷歌AI实现10公里级精准天气预报;10)Gartner预测到2028年80%的AI应用开发时间将缩短50%。

  • iPhone闹钟能自定义稍后提醒时间了 苹果iOS 26新功能上线

    近日,苹果公司发布了iOS26系统更新,其中一项看似细微却可能对用户日常生活产生显著影响的新功能引起了广泛关注——用户现在可以自定义闹钟稍后提醒的时间了。这一改变,或将悄然改变众多iPhone用户的起床习惯。 在之前的iOS版本中,iPhone闹钟的“稍后提醒”功能显得较为局限。用户一旦开启该功能,在闹钟响起时选择“稍后提醒”,闹钟便会在9分钟后再次响起,用户

  • 618抢先剧透!AI数字人分身系统重磅升级:自定义装修+智能体

    该文章介绍了一个智能装修系统的五大核心功能更新:1.新增可视化自定义装修功能,无需编程即可自由设计前端页面;2.接入AI智能体系统,自动生成精准营销文案;3.新增API接口分销功能,支持批零差价盈利;4.全面接入DeepSeek技术,实现多平台高质量文案生成;5.新增VIP会员模式,严格绑定功能权限与有效期。系统通过智能化升级,显著提升了装修设计、内容创作和商业变现的效率。

  • REDMI电竞小平板即将发布 王腾:对标iPad mini 配置拉满

    日前,REDMI电竞小平板正式入网,预计本月就会与消费者见面。今日,REDMI品牌总经理王腾对外透露,这是REDMI有史以来推出的首款旗舰小平板,其手感极佳,性能强劲,配置更是直接拉满,将全面对标iPad mini。 结合此前爆料信息来看,这款REDMI旗舰小平板亮点颇多。它搭载了一块8.8英寸定制的LCD屏,具备高分辨率与高刷新率,屏幕采用无孔圆角设计,视觉体验值得期待。

  • 卢伟冰:REDMI K Pad对标iPad mini

    REDMI正式官宣其首款旗舰小平板——REDMI K Pad,该产品将于近期发布。与此同时,小米集团合伙人、总裁,国际部总裁,Redmi品牌总经理卢伟冰发文透露,今年堪称小米平板业务的爆发之年,小米平板销量首次跻身全球前三,产品阵容完成换新,全面对标苹果iPad系列产品。 卢伟冰强调,5月发布的小米平板7Ultra直接对标苹果最高端的iPad Pro,而接下来即将发布的新品中,有两款�

今日大家都在搜的词: