首页 > 业界 > 关键词  > Seamless最新资讯  > 正文

仅两秒延迟!新一代AI语言翻译系统Seamless发布,实现跨语言交流新突破

2023-12-01 10:21 · 稿源:站长之家

划重点:

🗣️ 实时表达:Seamless首次公开发布,通过SeamlessExpressive和SeamlessStreaming模型,实现语音到语音翻译中的表达保留和低延迟流式处理。

🌍 多语言支持:SeamlessM4T v2基础上构建,覆盖英语、西班牙语、德语、法语、意大利语和中文等语言,实现真实感情和风格的跨语言传递。

🔄 数据工具公开:发布metadata、数据对齐工具,扩展SeamlessAlign语料库,助力研究社区收集更多翻译数据。

站长之家(ChinaZ.com)12月1日 消息:在我们日益互联的世界中,语言差异可能成为沟通的障碍。Seamless作为新一代AI语言翻译系统,通过SeamlessExpressive和SeamlessStreaming模型的首次发布,为实时、跨语言交流带来了全新的突破。

image.png

SeamlessExpressive是专注于语音到语音翻译的表达保留模型,而SeamlessStreaming则是一种流式翻译模型,以约两秒的延迟提供最先进的结果。这两个模型都基于SeamlessM4T v2,这是在8月份发布的基础模型的最新版本,展现了在自动语音识别、语音到文本、文本到语音等方面的性能提升。

image.png

与以往在表达性语音研究方面的努力相比,SeamlessExpressive更加关注韵律的某些未被充分探索的方面,例如语速和节奏停顿,同时保留情感和风格。该模型目前在英语、西班牙语、德语、法语、意大利语和中文之间的语音到语音翻译中保留了这些元素。

SeamlessStreaming的突破性在于实现了与说不同语言的人实时对话。与传统系统在说话者完成句子后进行翻译不同,SeamlessStreaming在说话者仍在说话时进行翻译,使得对话更接近实时。该模型支持近100种输入输出语言的自动语音识别和语音转文本,以及近100种输入语言和36种输出语言的语音到语音翻译。

除了模型本身,Seamless还在今天发布了metadata、数据和数据对齐工具,旨在帮助研究社区收集更多的翻译数据。这包括SeamlessAlign的扩展元数据,涵盖额外115,000小时的语音和文本对齐,以及SeamlessAlignExpressive的元数据,作为表达性焦点版本的数据集。此外,还提供了mExpresso的翻译文本数据,这是Expresso的多语言平行扩展,以及用于收集更多翻译数据的工具。

Seamless作为新一代AI语言翻译系统,在实现表达保留和流式处理方面取得了重要进展,为跨语言交流提供了更加自然和真实的体验。

举报

  • 相关推荐
  • 时空壶接入大语言模型,跨语言沟通已成翻译的艺术

    在当今全球化浪潮中,跨语言沟通的需求如潮水般汹涌。从商务领域的跨国谈判,到文化交流中的思想碰撞,高效、精准的语言翻译成为关键桥梁。随着技术的不断发展与迭代,时空壶有望持续引领行业变革,推动全球交流合作迈向新的高度,真正实现跨越语言障碍,让世界沟通无阻。

  • 性能与容量双飞跃,忆联发布新一代消费级2TB SSD AM6B0

    AI技术浪潮正推动全球PC产业革新,具备AI算力的终端设备——AIPC需求激增的同时,也催生存储向大容量、超高速SSD迭代升级。据Canalys预测,到2027年,全球60%的PC将搭载AI计算模块,数据处理效率与存储性能将成为企业的核心竞争力。忆联科技将继续秉承创新理念,致力于研发更多高品质的存储产品及解决方案,为推动数字化转型和智能化进程注入强劲动力,为用户创造更加美好的数字生活。

  • 华为将发布新一代高阶智能辅助驾驶系统ADS 4

    华为将于4月22日下午举办华为智能汽车解决方案大会,正式发布新一代高端智能辅助驾驶系统——ADS4。此次大会备受行业关注,将全程直播,让更多观众第一时间见证这一科技盛事。多家知名车企如比亚迪、赛力斯、北汽新能源、一汽集团、广本集团等11家汽车品牌将亮相支持ADS4。作为华为在智能驾驶领域的又一次突破,ADS4将在L3技术层面实现重要升级,为用户提供更加智能、安全的驾驶体验。同时,问界M9、M8等热门车型已率先升级到最新的ADS3.3系统,支持车到车位的全自动代客泊车功能。此外,ADS3.3的VPA代客停车场自动泊车功能也备受好评,让停车不再难题。这表明华为在智能驾驶技术上的深厚积累,展现出其不断追求创新的企业精神。

  • 技术革新引领跨语言沟通新境界 —— 时空壶 W4Pro AI 同传耳机的卓越突破

    在全球化深入推进的当下,跨语言沟通的顺畅与否深刻影响着国际交流的质量与成效。近期,美国网红“甲亢哥” 的中国行引发广泛关注,然而,随行翻译在过程中出现的诸多错误与不当表述,如将理发师对脏辫结构复杂的解释曲解为 “嫌头发脏”,用带有物化女性意味的 “Chinese chick” 介绍中国女性等,不仅引发国内舆论哗然,更对国际形象的传播造成负面影响,凸显出专

  • IBM发布新一代大型主机IBM z17:为AI时代量身定制,全方位解锁企业级应用

    ·创新技术旨在解锁企业级AI的规模应用,包括大语言模型和生成式AI·全新的AI助手和AI智能体重塑用户体验北京2025年4月9日--今天,IBM宣布推出新一代大型主机IBMz17。

  • 微信聊天消息自动翻译功能上线 支持18种语言

    微信官方公众号“微信派”发布消息,宣布微信最新版本中新增了聊天消息自动翻译功能,以及优化了批量转发聊天记录的操作体验。用户只需在微信的“我-设置-通用-翻译”中勾选“自动翻译聊天中收到的消息”,即可实现无需逐条长按翻译的便捷操作。此次微信的功能升级,不仅提升了用户体验,也进一步展现了微信作为社交平台的实用性和创新性。

  • 时空壶接入DeepSeek、豆包等大语言模型,翻译准确度再次跃升

    在全球跨语言沟通需求持续攀升的当下,时空壶再次以创新之举震撼行业。时空壶正式宣布接入DeepSeek、豆包等大语言模型,为其同传耳机产品带来了前所未有的体验升级,彻底改写了同传翻译的游戏规则,也让传统机翻模式成为历史。这一创新举措不仅满足了当下各行业对高质量跨语言沟通的迫切需求,更为未来跨语言交流的发展指明了方向,有望推动整个行业向更加智能、精准、自然的方向迈进,助力全球交流合作开启全新篇章。

  • 把影院带回家,2025索尼BRAVIA新一代影院电视发布

    2025 年 4 月 15 日,索尼正式发布了BRAVIA新一代影院电视产品阵容,在现有高端产品线的基础上,拓展了中端产品线,推出 2 款电视新品——新一代轻旗舰Mini LED索尼电视 5 系与高画质智能电视 3 系。至此,索尼电视全系列可以满足用户从基础观影到影院级视听享受的多样化需求,且电视尺寸实现了从 43吋、 50 吋、 55 吋、 65 吋、 75 吋、 85 吋到 98 吋大尺寸的全覆盖,将影院级巨

  • “中年女人的唯一快乐”成新一代抽象热梗,谁拍都能火?

    流量不停,抽象不止。这不,互联网上的抽象“艺术”又多了一种——只见一个画着复古细眉的中年女人,每天下班后回到她那间大红色的“婚房”里,手舞足蹈地跳上几段舞,对镜头夹起声音邀请大家来看“一个中年女人下班后唯一快乐”。馒头漂泊生活,赞2.1万鬼迷日眼的画风,令人上头的口音,硬控了不少网友,也让这个“中年女人”在互联网小范围火了一把,成功博�

  • 视源股份智慧零售解决方案亮相第137届广交会,展示新一代神器

    在第 137 届广交会上,视源股份带来其创新的智慧零售解决方案,涵盖新一代数字标牌系统以及家电显控模组等多款产品。其中,数字标牌系统可实现远程智能管理;家电显控模组则为零售终端提供智能化交互方案。这些创新产品不仅展现了视源股份体现了其对全球零售行业的深刻洞察。数字标牌赋能商业新场景视源股份围绕智慧零售领域全面发力,推出了一系列新一代引流神