首页 > 业界 > 关键词  > 扎克伯格最新资讯  > 正文

扎克伯格演示使用 Meta 新 AI 语音翻译技术直接翻译闽南语

2022-10-20 17:35 · 稿源:站长之家

站长之家(ChinaZ.com) 10月20日消息:Meta 推出名为「S2UT」(speech-to-unit translation) 的翻译技术,将使原本没有特定文字书写记录的语言,可以直接通过语音对语音翻译方式转换成另一种语言,例如将中国台湾等亚洲地区众多人使用的闽南语直接翻译成英语,同时也能将英语直接翻译成闽南语。

Meta,元宇宙,Facebook

据介绍,为开发这个只有语音的全新翻译系统,Meta AI 研究人员必须克服许多来自传统机器翻译系统的挑战,包括数据收集、模型设计以及准确度评估。其中一个重大障碍在于是否能够收集到足够的数据,由于闽南语是所谓的资源匮乏语言,未有足够的训练数据;此外,能将英语翻译成闽南语的翻译人员相对较少,因此更难以收集数据资料并加上注解来训练模型。为此 Meta 利用中文作为中间语言,以建立伪标签和人工翻译,也就是说先将英语(或闽南语)语音翻译成中文文字,接着再翻译成闽南语(或英语),然后新增至训练数据中。

另一种产生训练数据的作法是语音探勘,Meta 使用预先训练好的语音编码器,便能通过编码方式将闽南语语音嵌入内容加入到其他语言的相同语意空间中,而无须取得闽南语的书写文字。闽南语语音可以和拥有相似语意嵌入内容的英语语音和文字配对。接着 Meta 从文字来合成英文语音,产生平行的闽南语和英语语音。

扎克伯格宣布,Meta 接下来将对外开放名为「LASER」的自然语言处理工具,所打造 SpeechMatrix 大型语音对语音训练模型,让更多研究人员可以建立众多无法通过文字记录的语言,让更多语言可以通过人工智能方式翻译成其他语言。

扎克伯格演示可翻译闽南语的 AI 翻译技术:

https://www.Facebook.com/4/videos/2725795187550922/

举报

  • 相关推荐
  • VITA平台赋能AI办公,沸蛇AI语音鼠标提升办公效率

    云决科技推出VITA一站式AI办公平台,结合自研AI语音鼠标,通过软硬件协同创新提升企业效率。该平台集成DeepSeek等大模型,用户无需切换工具,语音即可调用文字处理、数据分析、创意设计等多元功能,实现会议纪要生成、PPT自动制作、视频一键合成等操作,节省80%工作时间。针对教育、IT、行政等不同行业提供专属解决方案,整合100多个AI应用场景和200多种模板,持续优化产品功能,致力于成为职场人士提升效率的智能助手。

  • 重磅预告:全链路自主进化 AI 数据分析师 TabTab 将于10月24日上线

    灵快科技推出的AI数据分析师TabTab将于10月24日上线。该产品通过Multi-Agent系统实现全链路自动化数据分析,覆盖数据获取、建模到可视化全流程。用户可用自然语言交互,系统自主规划任务并输出可维护结果,支持Excel、PPT等多种报告格式。核心定位为智能数据分析助手,旨在降低分析门槛,助力企业高效挖掘数据价值,适用于数据分析师、营销人员等各类用户。

  • 数据智能体 TabTabAI 正式上线,零门槛上手,让 “数据分析” 人人可用

    AI数据智能体TabTabAI正式上线,以“零门槛交互+全流程自主处理”为核心优势,打破数据分析技术壁垒。该工具通过自然语言对话,支持多源数据采集、智能处理、深度洞察与可视化,让普通职场人无需编程背景即可完成复杂分析任务。其多智能体协同架构与自动化能力,覆盖从数据收集到决策建议的全链路,助力用户将原始数据高效转化为精准决策依据,真正实现“人人都是数据分析师”。

  • OpenAI 推出浏览器:“让位吧,Chrome”

    ​北京时间10月22日凌晨,没等来传闻中的Gemini3,等来了OpenAI正式发布首款AI浏览器ChatGPT Atlas。 简单来说,这是一个把ChatGPT"塞进"浏览器的产品,你在任何网页上都能随时唤出ChatGPT侧边栏,让AI帮你总结内容、编辑文字、甚至代替你完成购物和预订任务。 听起来有点像Chrome装了个ChatGPT插件?确实如此,但OpenAI的野心远不止于此。

  • “全球Robotaxi第一股”文远知行:港股上市临近,商业化进程加速

    文远知行通过港交所聆讯,正式进入港股上市冲刺阶段,将构建“美股+港股”双资本平台。作为全球自动驾驶标杆企业,其产品已在7个国家获自动驾驶牌照,在11国30城开展测试运营,安全运营超2200天。技术层面,预测算法误差控制在0.2米内,感知模型延迟小于10毫秒,系统检测精度达99%。成本大幅下降,单车成本降至几十万元,二季度营收同比增长60.8%,自动驾驶网约车业务猛增836.7%。近期获准在北京开展夜间道路测试,向全天候服务网络迈出关键一步。随着技术成熟与商业模式验证,万亿级自动驾驶市场正迎来规模化运营拐点。

  • AI日报:谷歌发布Veo 3.1;通义千问推Qwen Chat Memory功能;Sora2免费用户可生成15秒视频

    本期AI日报聚焦多项技术更新:谷歌Veo 3.1视频模型新增音频生成与精细化编辑功能;通义千问推出记忆功能提升对话连贯性;Sora2免费用户可生成15秒视频,Pro版支持25秒;百度文心助手升级8种创作模式;谷歌Flow工具增强视频光影编辑与音频合成能力;Anthropic发布高性价比Claude Haiku 4.5;北京查处首例AI虚假广告案,涉伪造主持人带货;阿里推出响应仅200毫秒的编程工具Qoder CLI。

  • iOS 26液态玻璃效果能关了 苹果iOS 26.1 Beta 4新增液态玻璃开关

    苹果公司10月21日向iPhone用户推送iOS 26.1开发者预览版Beta4更新,新增Liquid Glass液态玻璃透明度切换开关,用户可将界面调整为“色调”模式以增强通知可读性。此次更新延续iOS 26的液态玻璃设计语言,带来更沉浸的视觉体验。同时支持关闭锁屏滑动相机功能避免误触,并扩展Apple Intelligence对丹麦语、荷兰语、繁体中文等七种语言的支持,让更多地区用户享受智能服务。

  • 连续三年折桂!瓴羊Dataphin荣膺2025年度DAMA数据治理优秀产品奖!

    2025全球数据管理峰会以“数据×人工智能”为主题,聚焦行业最佳实践,构建从理念探讨到技术落地的完整交流链。会上,瓴羊与DAMA联合发布数据治理实践证书体系,覆盖数据分析等认证,旨在提升全民数据素养。瓴羊副总裁王赛提出Data与AI双向赋能重构企业数字化生产力,强调未来系统需支持自主决策与自动化执行。以快消品牌为例,通过Quick BI智能分析工具实现业务效率提升。瓴羊Dataphin平台助力企业构建AI友好型数据模型,连续三年获“数据治理优秀产品”大奖,提供全链路数据服务,加速释放数据价值。

  • 真我GT8 Pro首发!realme UI 7.0正式版升级计划公布

    真我中国区总裁徐起公布realme UI 7.0正式版升级计划:即将发布的真我GT8 Pro将首发搭载该系统,并公布了老机型适配时间表。2025年11月起,真我GT7 Pro、GT7等机型开始升级;12月覆盖真我GT5 240W、14 Pro等;2026年1月扩展至真我GT Neo5系列、数字系列及V系列等多款机型。

  • Qwen登顶AI赚钱大赛只是开始?“弃GPT投Qwen”已在硅谷蔓延开来

    近期AI炒币大赛Alpha Arena引发关注,六款主流大模型用1万美元本金在币圈实战。戏剧性的是,被寄予厚望的GPT-5和Gemini因高杠杆操作亏损惨重,而中国开源模型表现亮眼——通义千问Qwen以53%回报率逆袭登顶,DeepSeek紧随其后。硅谷巨头Airbnb CEO公开表态依赖Qwen,投资人Chamath也承认将业务转向中国模型。市场用真金白银投票:预测平台押注Qwen胜率高达36%,远超OpenAI的3%。这场竞赛虽存随机性,但中国开源阵营已展现强劲势头。

今日大家都在搜的词: