首页 > 业界 > 关键词  > Meta最新资讯  > 正文

Meta发布机器学习模型Voicebox:可从文本生成语音 精通六门语言

2023-06-19 11:50 · 稿源:站长之家

站长之家(ChinaZ.com)6月19日 消息:日前,Meta平台的人工智能研究部门推出了名为Voicebox机器学习模型,可以将文本转换为语音。

与其他文本转语音模型不同的是,Voicebox能够执行许多未经过训练的任务,包括编辑、去除噪音和样式转换。

image.png

为训练模型,Meta的研究人员使用了一种名为“ “Flow Matching” ”的方法,该方法比其他生成模型中使用的扩散学习方法更高效和通用。由于担心滥用,Meta并没有发布Voicebox,以及将来可以支持很多应用。

Voicebox是一种生成模型,可以在英语、法语、西班牙语、德语、波兰语和葡萄牙语等六种语言中合成语音。它通过学习将语音音频样本映射到其转录本的模式来进行训练,从而可以用于许多下游任务。

与特定应用程序训练的生成模型不同,Voicebox在训练过程中使用文本作为训练目标,训练过程中,模型会预测语音片段,中间部分被屏蔽,根据周围的音频和文本转录本进行推理学习,学习使用文本生成自然语言语音。

Voicebox的一个有趣应用是语音采样。该模型可以从单个文本序列中生成各种语音样本。这种能力可用于生成合成数据来训练其他语音处理模型。“我们的结果表明,在Voicebox生成的合成语音上训练的语音识别模型的性能几乎与在真实语音上训练的模型一样好,错误率下降了1%,而在以前的文本到语音模型中,合成语音的错误率下降了45%到70%,”Meta写道。

不过Voicebox也有一定限制。由于它已经过有声读物数据的训练,因此它不能很好地转移到随意且包含非语言声音的对话语音中。它也不能完全控制生成的语音的不同属性,例如语音风格、语气、情感和声学条件。Meta团队还在探索技术来克服这些限制。

官方介绍网址:https://ai.facebook.com/blog/voicebox-generative-ai-model-speech/

举报

  • 相关推荐
  • Meta新品发布,技术路线与影目INMO“撞车”,中国智造先行优势凸显

    三星Galaxy S25系列专为学生群体打造,融合AI生产力、影像创作与性能释放。通过Galaxy AI实现智能笔记、实时翻译等功能提升学习效率;搭载多摄系统与AI影像引擎,支持复杂场景拍摄;配备骁龙8芯片和优化散热系统,兼顾游戏娱乐与续航表现。轻薄设计搭配多款配色,满足个性化需求,现可通过教育优惠活动实惠入手。

  • 亚马逊入局竞逐AR眼镜行业,Meta/谷歌/微美全息以“硬件+生态”双赛道策略领先

    亚马逊正加速布局AR眼镜市场,开发两款产品:面向物流司机的"Amelia"和面向消费者的"Jayhawk"。科技巨头纷纷入局,Meta、谷歌、苹果等均在研发相关产品。中国消费级AR眼镜市场2025年上半年增长显著,销量达26.2万台,同比增长73%。行业预计未来三年规模有望达千亿级别,AR眼镜正从"小众玩具"迈向"大众智能终端"。

  • 苹果首款智能眼镜曝光:无显示屏 类似Meta、小米

    虽然苹果开发了配置非常强劲全面的Vision Pro,但苹果也没打算放弃更轻便的智能眼镜。 据名记马克古尔曼(Mark Gurman)最新报告,苹果将在未来12至16个月内推出智能眼镜。 这款产品没有显示屏,定位与Meta、小米等产品类似,配备摄像头、收音和播放,需要连接iPhone实现数据处理。 功能应该跟此前产品都类似,可以实现拍照、录像、听音乐等常规操作。 预计还能通过新版S

  • 华为云CloudRobo构筑云上机器人工厂,助力机器人开发应用成本全面降低

    华为在2025全联接大会上发布CloudRobo具身智能平台,通过云端赋能打破机器人硬件限制,实现轻量化、智能化和场景泛化。该平台整合数据生产、训练及运行管理,支持多领域落地应用,并联合行业伙伴共建R2C协议,推动具身智能产业规模化发展。

  • 真我Neo7 Turbo AI版发布 首款动感地带AI手机

    日前,真我Neo7TurboAI版发布,这是真我联合中国移动打造的首款动感地带AI手机。 与真我Neo7Turbo标准版相比,新机后盖多了中国移动Logo。 官方表示,真我Neo7TurboAI版将带来极速性能、偶像陪伴、运动竞技、云端空间、社交潮流五大专属体验。 真我Neo7TurboAI版负一屏植入芒果卡俱乐部,集成芒果TV、咪咕视频等App,自带咪咕体育、咪咕快游会员,支持中国移动云盘等服务。 据�

  • Meta雷朋第三代智能眼镜亮相在即,三星/微美全息领航消费级XR助推行业增长!

    Meta与雷朋合作的第三代智能眼镜渲染图曝光,预计今年发布,定价300-500美元。新一代眼镜强调AI功能升级,支持实时物体识别与场景理解。Meta还将在9月Connect大会推出首款带显示屏的智能眼镜Hypernova,售价约800美元,并配套手势控制腕带。与此同时,三星确认将于9月推出XR头显Project Infinite,售价约1800-2900美元。智能眼镜市场正迎来爆发期,2025年Q1全球出货量激增82.3%,中国增长116.1%。微美全息等企业加速布局,行业期待未来2-3年迎来真正拐点。

  • 曝MacBook塞进iPhone处理器:售价亲民

    分析师郭明錤透露,苹果MacBook系列新品规划:2026年底量产OLED版MacBook Pro,配备触控面板;2025年Q4推低价版MacBook,搭载iPhone同款A18 Pro处理器,目标年轻用户,配13英寸屏和多彩外壳,支持AI任务。苹果希望通过低价产品扩大市场份额。

  • 双雄联袂登场 世纪华通旗下Century Games确认参展2025东京电玩展

    世纪华通旗下Century Games将携《Whiteout Survival》与《Kingshot》两款游戏亮相东京电玩展2025。展台位于Hall5-C04,面积达300平方米,设有裸眼3D巨屏展示、主题展区及丰富互动活动。两款游戏市场表现强劲:《Whiteout Survival》连续15个月位居中国手游出海收入榜首,《Kingshot》上线后收入快速增长,7月两款游戏包揽中国手游出海收入榜冠亚军。此次参展旨在向全球玩家展示中国游戏的创新实力,拓展国际合作。

  • 腾讯云大数据升级Data+AI能力体系,构建AI-Ready的数据智能平台

    9月17日,腾讯云在数字生态大会上宣布升级大数据产品矩阵Data+AI能力体系,覆盖底层架构、数据平台、数据应用全流程,助力企业应对数据治理、多模态融合与智能化应用等挑战。通过云原生架构、Data+AI一体化和Agent增强,推出TCLake智能数据湖、流湖引擎和企业级搜索ES,提升数据处理效率与智能化水平。WeData平台升级为端到端一体化Data+AI平台,打通数据接入、治理、建模、训练到推理全链路。引入AI+Agent能力,通过Data Agent和ChatBI等创新实践,将智能能力融入数据使用各环节,助力企业释放数据价值,形成差异化AI竞争力。

  • 无视乔布斯意愿!曝苹果触摸屏MacBook Pro明年量产:19年来首次

    苹果首款支持触控屏的MacBook Pro预计2026年底量产,采用OLED屏幕和on-cell触控技术。这与乔布斯2010年反对触控屏Mac的立场形成对比,当时他认为垂直触控表面"从人体工程学角度非常糟糕"。2025年底将推搭载iPhone处理器的廉价版MacBook,但不支持触控;第二代或于2027年加入触控功能。这一转变基于对iPad用户习惯的观察,认为触控输入能提高生产力。此前2023年已有类似消息透露苹果工程师正积极研发触控Mac。

今日大家都在搜的词: