OpenVoice V2版本发布能对声音风格进行精细控制

2024-04-26 09:41 · 稿源：站长之家

站长之家（ChinaZ.com）4月26日消息:MyShell TTS 开发的 OpenVoice 是一项创新的声音克隆技术，它能够通过仅使用一小段参考发言者的音频片段来复制其声音，并生成多种语言的语音。

QQ截图20240426094050.png

目前，MyShell TTS 已经推出了全新的OpenVoice V2版本。这个版本能够直接支持英语、西班牙语、法语、中文、日语以及韩语，并且显著提高了音频输出的质量。OpenVoice V2拥有复制任意声音的能力，能以多种语言进行语音输出，并具备情感和口音的控制功能。它不但可以准确模仿特定的声音色彩，还允许对声音的风格，包括情感、口音、节奏、停顿及语调等进行细致调整。

主要功能:

准确的音色克隆: OpenVoice 能够精确地克隆参考音色，并在多种语言和口音中生成语音。
灵活的声音风格控制: 用户可以对声音的情绪、口音、节奏、停顿和语调进行详细调整，实现个性化的声音输出。
零样本跨语言声音克隆: 即使某些语言未在训练集中出现，OpenVoice 也能实现声音复制。
高效的计算性能: 相比于市场上现有的商业API，OpenVoice 在保持高性能的同时，计算成本大大降低。

OpenVoice V2新特性:

更好的音频质量: 采用新的训练策略提升音频质量。
原生多语言支持: 原生支持英语、西班牙语、法语、中文、日语和韩语。
集成 MeloTTS: V2版本引入了 MeloTTS 技术，增强了声音的自然度和表现力。
免费商业使用: 自2024年4月起，V1和V2版本均以 MIT 许可证发布，支持商业和研究用途的免费使用。

技术方法:

声音样式和语言的解耦设计: OpenVoice 的设计哲学是将声音的不同特性进行解耦，使得可以独立控制各个参数，提高操作的灵活性和推断速度。

基础发音者 TTS 模型与音色转换器: 包括允许对风格参数进行控制的基础发音者 TTS 模型，以及采用编码器-解码器结构的音色转换器。

训练策略和数据处理: 在训练过程中，使用了大量的多语种、多风格的音频样本，并采用特定的损失函数确保在保留风格的同时去除或转换音色。

官网：https://research.myshell.ai/open-voice

项目地址：https://top.aibase.com/tool/openvoice

创建自己的语音机器人：https://myshell.ai/

（举报）

相关推荐

关键词：

阿联酋部长在京见证｜Klickl与Investopia开启全面战略合作

2025年9月19日，阿联酋数字金融平台Klickl与阿联酋政府支持的全球投资平台Investopia在北京签署全面战略合作协议。双方将在金融科技、数字金融基础设施、绿色能源投资、跨境支付与资本对接等重点领域展开深度合作，推动中阿经贸合作从政策沟通迈向实体产业协同。Klickl将于2026年起成为Investopia全球战略合作伙伴，共同打造区域经济联动与全球共建的新里程碑。

阿联酋数字金融中阿经贸合作数字经济
华为FreeClip 2耳夹耳机发布：搭载自研NPU AI处理器 1299元

华为于9月24日正式发布全新FreeClip 2耳夹式耳机，售价1299元，10月14日开启预售，10月20日正式上市。耳机主打独特设计、卓越性能与丰富功能，提供丹宁蓝、摩登黑、羽纱白三色可选。充电盒采用玲珑方盒设计，体积缩小17%，耳机本体重量减轻9%至5.1克，佩戴更轻盈舒适。搭载华为自研第三代音频芯片，首款集成NPU+AI处理器，算力提升10倍，支持超澎湃双擎单元，音质与低频动力均提升100%。具备IP57级防尘抗水抗汗能力，支持左右耳自适应技术，无需区分左右耳即可佩戴。AI功能方面，支持鸿蒙AI耳边助手，可实现随唤随应、连续对话等便捷操作，并具备实时听译功能，支持中文与20种语言互译。续航方面，单耳续航达9小时，整机续航长达38小时，满足长时间使用需求。此外，耳机还支持离线查找与楼层定位功能，充电盒新增近距离星闪精准查找，50米内轻松找回耳机。

华为FreeClip2 耳夹耳机新品发布
Reviews.ai 依托 DigitalOcean 高效实现 AI 业务扩展

Reviews.ai是一个消费者反馈聚合平台，帮助品牌将客户评论转化为可执行的洞察。该平台专注于评论分析，通过AI驱动功能（如按需报告、主题分类和智能代理）提升产品与服务。近期从Review Monitor更名后，团队迁移至DigitalOcean云平台，解决了原有专用服务器架构的扩展瓶颈。迁移过程在合作伙伴Aquazeel支持下高效完成，仅用数周，成本降低近30%。新架构采用Droplets、托管数据库和负载均衡器，支持灵活扩展。未来计划利用GPU Droplets增强AI能力，进一步优化大型语言模型处理效率。

消费者反馈品牌洞察评论分析
京东推出AI购物APP京犀：帮你选出最心仪商品

9月25日，2025京东全球科技探索大会在京开幕。京东宣布未来三年将持续加大投入，推动人工智能技术与实体产业深度融合，目标构建覆盖全产业链的万亿级AI生态体系。作为战略落地的关键一步，京东正式推出新一代购物与生活服务超级入口“京犀”App，通过AI技术重构消费体验，引发行业高度关注。该应用将AI深度嵌入购物全流程，基于用户行为与商品特征精准理解需求，智能推荐商品并优化结算路径，实现“无感式”顺畅下单。平台整合餐饮、票务、住宿等高频生活服务场景，用户通过语音指令即可完成全流程操作。此次将AI能力全面开放至消费端，标志着京东从“供应链技术提供商”向“生活服务生态构建者”的角色升级。

京东科技 AI生态京犀App
天网杯纳米AI视频创作赛圆满落幕，ISC.AI学苑推动“教育AI+”新范式

9月23日，第三届“天网杯”网络安全大赛在天津落幕，吸引全国顶尖战队角逐，同期举办纳米AI视频创作赛。赛事聚焦个人信息保护、防诈骗等网络安全议题，通过“以赛促学”模式提升学生防护意识与AI应用能力。ISC.AI学苑作为平台支持，依托“纳米AI”技术降低创作门槛，推动“安全+AI”人才培养。大赛评选出24个奖项，并联合多所高校深化合作，促进AI技术在教育场景的落

天网杯网络安全大赛纳米AI
OPPO Watch S官宣：轻薄表皇

OPPO宣布将于10月16日推出OPPO Watch S智能手表，主打“轻薄表皇”设计，厚度不足9mm，号称目前市面上最薄的智能圆表。搭载全新智能手表系统，操作体验媲美手机，健康配置亦有惊喜。同时具备“健身教练”功能，可自动识别运动并提供超100种运动模式，专业记录数据。此外，发布会还将推出OPPO Find X9和X9 Pro旗舰手机，首批搭载联发科天玑9500平台，出厂预装全新ColorOS 16系统。

OPPO Watch S
荐AI日报：阿里云开源通义DeepResearch；夸克推医师考试大模型

本期AI日报聚焦多项前沿动态：阿里云开源轻量级AI代理DeepResearch，性能媲美OpenAI；夸克推出国内首个全阶段医师考试大模型测试集；微软Copilot将上线类ChatGPT记忆管理功能；迪士尼等巨头起诉MiniMax侵犯版权；OpenAI提升ChatGPT搜索准确性；Notion推出个性化AI助手；谷歌发布更小巧高效的时间序列预测模型TimesFM-2.5；Figma推出AI设计功能简化创作流程。整体展现AI技术在开源、医疗、�

AI 开源轻量级
OPPO Pad5官宣10月16日发布首发ColorOS 16

OPPO Pad5将于10月16日发布，搭载全新ColorOS 16系统，主打流畅体验。系统升级三大核心技术引擎，实现无缝动画效果，并首次将原生级流畅能力开放给第三方应用。硬件方面配备12.1英寸3K高刷屏和联发科天玑9400处理器，支持67W快充，兼顾高性能与长续航。针对海外用户优化虚拟键盘操作，提升切换效率。产品定位“丝滑板王”，旨在引领安卓平板体验新高度。

OPPO Pad5 ColorOS16
StarRocks Connect 2025 圆满落幕：AI Native 时代，数据分析未来已来

StarRocks Connect 2025峰会圆满落幕，聚焦AI Native时代的数据分析未来。活动汇聚全球开发者与行业专家，分享StarRocks在复杂业务场景中的实践，探讨技术演进方向。从性能引擎到AI原生平台，StarRocks 4.0将支持多智能体协作框架，提升数据分析效率。多家企业展示应用案例，覆盖电商、金融、旅游等领域，验证了其高性能与成本优势。开源精神推动技术创新，共同探索数据智能的无限可能。

StarRocks 数据分析 AI
浪漫自在，悦己之声森海塞尔ACCENTUM Open 真无线耳机樱花粉上市

森海塞尔于2025年9月22日在北京发布ACCENTUM Open真无线耳机樱花粉配色。新品在保持卓越音质的同时，以柔和樱花粉点缀耳畔，融合半开放式声学结构与舒适贴耳设计，支持蓝牙5.3多设备连接、双麦克风降噪及28小时续航。耳机单只仅重4.35克，配备IPX4防水，兼顾轻盈佩戴与全天候使用。樱花粉作为继经典黑白后的新配色，将于9月28日正式发售。森海塞尔强调其致力于创新音频解决方案，2025年正值品牌创立80周年，持续为客户打造独特声音体验。

森海塞尔 ACCENTUM Open

今日大家都在搜的词：

热文

3 天
7天

OpenVoice V2版本发布能对声音风格进行精细控制

阿联酋部长在京见证｜Klickl与Investopia开启全面战略合作

华为FreeClip 2耳夹耳机发布：搭载自研NPU AI处理器 1299元

Reviews.ai 依托 DigitalOcean 高效实现 AI 业务扩展

京东推出AI购物APP京犀：帮你选出最心仪商品

天网杯纳米AI视频创作赛圆满落幕，ISC.AI学苑推动“教育AI+”新范式

OPPO Watch S官宣：轻薄表皇

荐AI日报：阿里云开源通义DeepResearch；夸克推医师考试大模型

OPPO Pad5官宣10月16日发布首发ColorOS 16

StarRocks Connect 2025 圆满落幕：AI Native 时代，数据分析未来已来

浪漫自在，悦己之声森海塞尔ACCENTUM Open 真无线耳机樱花粉上市

今日大家都在搜的词：

热文

微信新功能上线：长按图片“搜一搜” 检索购物转表一键达

AI日报：生数科技推出Vidu Q2；火山引擎推出炉米Lumi；通义千问

雷军称没什么好犹豫的：50岁正是闯的年纪

小米非常非常缺人上热搜雷军谈小米成功秘诀

苹果回应iPhone17 Pro划痕：展示机问题将改善

AI日报：京东物流推出超脑大模型2.0；DeepSeek V3.1终结版发布

小米17标准版正式发布：售价4499元起首发第五代骁龙8至尊版

卢伟冰：小米17全球首发骁龙8 Elite Gen5

雷军：小米17标准版加量不加价年度演讲时长大约2个半小时

小米汽车定制服务发布：每月限量 40 台选配金额需超10万元

华为WATCH GT 6/Pro系列手表发布售价1488元起

微信新功能上线：长按图片“搜一搜” 检索购物转表一键达

雷军公布小米17标准版外观：1.18mm窄边框、6.3英寸直屏

AI日报：接入MJ！夸克发布造点AI；Wan2.5-Preview发布；可灵推

全新问界M7小订破22万：将于明晚上市公布价格

AI日报：阿里推多模态模型Qwen3-Omni；谷歌推出AP2协议；百度推

AI日报：美团发布推理大模型LongCat-Flash-Thinking；阿里Wan-

ColorOS 16将于10月15日发布 Find X9系列全球首发搭载

折叠屏iPhone细节曝光采用超薄钛合金：预计售价2000美元起

雷军演讲主题《改变》官宣：聊玄戒芯片和小米汽车背后的故事

站长商机

OpenVoice V2版本发布 能对声音风格进行精细控制

今日大家都在搜的词：

热文

站长商机

OpenVoice V2版本发布能对声音风格进行精细控制