首页 > 业界 > 关键词  > Seamless最新资讯  > 正文

仅两秒延迟!新一代AI语言翻译系统Seamless发布,实现跨语言交流新突破

2023-12-01 10:21 · 稿源:站长之家

划重点:

🗣️ 实时表达:Seamless首次公开发布,通过SeamlessExpressive和SeamlessStreaming模型,实现语音到语音翻译中的表达保留和低延迟流式处理。

🌍 多语言支持:SeamlessM4T v2基础上构建,覆盖英语、西班牙语、德语、法语、意大利语和中文等语言,实现真实感情和风格的跨语言传递。

🔄 数据工具公开:发布metadata、数据对齐工具,扩展SeamlessAlign语料库,助力研究社区收集更多翻译数据。

站长之家(ChinaZ.com)12月1日 消息:在我们日益互联的世界中,语言差异可能成为沟通的障碍。Seamless作为新一代AI语言翻译系统,通过SeamlessExpressive和SeamlessStreaming模型的首次发布,为实时、跨语言交流带来了全新的突破。

image.png

SeamlessExpressive是专注于语音到语音翻译的表达保留模型,而SeamlessStreaming则是一种流式翻译模型,以约两秒的延迟提供最先进的结果。这两个模型都基于SeamlessM4T v2,这是在8月份发布的基础模型的最新版本,展现了在自动语音识别、语音到文本、文本到语音等方面的性能提升。

image.png

与以往在表达性语音研究方面的努力相比,SeamlessExpressive更加关注韵律的某些未被充分探索的方面,例如语速和节奏停顿,同时保留情感和风格。该模型目前在英语、西班牙语、德语、法语、意大利语和中文之间的语音到语音翻译中保留了这些元素。

SeamlessStreaming的突破性在于实现了与说不同语言的人实时对话。与传统系统在说话者完成句子后进行翻译不同,SeamlessStreaming在说话者仍在说话时进行翻译,使得对话更接近实时。该模型支持近100种输入输出语言的自动语音识别和语音转文本,以及近100种输入语言和36种输出语言的语音到语音翻译。

除了模型本身,Seamless还在今天发布了metadata、数据和数据对齐工具,旨在帮助研究社区收集更多的翻译数据。这包括SeamlessAlign的扩展元数据,涵盖额外115,000小时的语音和文本对齐,以及SeamlessAlignExpressive的元数据,作为表达性焦点版本的数据集。此外,还提供了mExpresso的翻译文本数据,这是Expresso的多语言平行扩展,以及用于收集更多翻译数据的工具。

Seamless作为新一代AI语言翻译系统,在实现表达保留和流式处理方面取得了重要进展,为跨语言交流提供了更加自然和真实的体验。

举报

  • 相关推荐
  • 多模态交互+健康新突破,歌尔发布新一代智能指环参考设计

    传感器技术、大数据、云计算、物联网以及人工智能技术的蓬勃发展,为智能穿戴设备集成更多健康监测功能提供技术支持。智能指环作为新型可穿戴终端,可将最新技术与生活方式结合,凭借其便携和实时性在健康监测、交互领域展现出独特优势。歌尔自2013年进入智能穿戴领域,可根据客户需求提供不同产品形态的智能穿戴整体技术制造方案,未来,歌尔将继续推动技术革新,不断探索智能穿戴设备的新可能,助力用户实现便捷、智能、健康的生活方式。

  • •上海AI独角兽MiniMax发布新一代开源模型,创新突破受海内外好评

    日月开新元,万象启新篇。1月15日,MiniMax发布并开源新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。受益于LinearAttention层面的架构创新、算力层面的优化,以及集群上的训推一体的设计,MiniMax以业内极具性价比的价格提供文本模型和多模态理解模型的API服务,标准定价是输入token1元/百万token,输出token8元/百万token。

  • AI眼镜,新一代时尚单品还是“吃灰神器”?

    如今提起AI眼镜,人们最先想到的场景是:只要戴上这一副眼镜,无论身处何处,眼前的任何外文都能被实时翻译,并直接显示于镜片上;当然,实时拍照、录制视频、实时导航……大部分你能想到的功能,都能通过一副看似平常的眼镜实现。回想2012年,当被Google称为“登月计划”的GoogleGlass上线发布,却惨遭遇冷,不仅没有大卖,最终还于2015年暂停售卖。人们对科技配件这样的

  • 科龙新一代中央空调借政策东风,领市场新潮

    2024年政府工作报告在部署今年政府工作任务时,要求“加强生态文明建设,推进绿色低碳发展”,在绿色低碳产业飞速发展的同时,各地补贴政策也相继出台。在这一政策导向下,中央空调行业也迎来新的发展机遇,各地政府不仅提供多项税收减免、资金补贴等优惠政策加大对绿色节能产品的推广力度,进一步激发了中央空调市场活力。科龙空调也将积极响应政府号召,推动绿色低碳发展,为家电行业的可持续发展贡献力量。

  • 赛趋科推出新一代生成式AI设计工具,助力时尚鞋服新兴品牌加速创新

    美国加利福尼亚州坎贝尔,2024年12月6日——赛趋科正式宣布,面向新兴品牌推出生成式AI图像工具——CentricAIFashionInspiration,该工具旨在赋能服装、鞋履和配饰领域快速增长的企业,通过赛趋科PLM平台实现设计流程的智能化升级。在竞争激烈的服装行业中,新兴品牌面临着资源有限与快速推出新品的双重挑战。这些方案将全面覆盖产品的规划、设计、开发、采购、生产、定价、销售及配补货等各个环节,助力更多企业达成战略与运营的数字化转型目标。

  • 固态电池新突破:将减掉负极 只留下正极

    近日,太蓝新能源宣布与南都电源签署固态电池战略合作协议,双方将共同推进固态电池在储能领域及民用领域的规模化应用。太蓝新能源表示,技术创新的目标是实现规模化落地,只有具备了大规模量产能力,才能真正驱动产业发展。今年4月,该发布了全球首款容量达120Ah、能量密度达到720Wh/kg的全固态锂金属电池,刷新了固态电池最大单体容量和最高能量密度的世界纪录。

  • 理想同学App测试版抢先看!支持识物、翻译、语音交流

    在日前举办的2024理想AITalk”直播中,理想汽车CEO李想就AI等话题展开对话。李想还宣布理想同学App将在12月27日正式上线手机端。希望可以让理想汽车的100多万用户,再加上这些用户的家庭,大概300-500万人,不仅可以在车上体验到一致的人工智能产品可以在手机、电脑甚至未来的眼镜上都能享受到这种体验,这是理想必须要做的。

  • 我国新一代火箭主动力发动机新进展:首次一日三试成功

    据报道,我国在航天科技集团六院165所位于抱龙峪的试验区,成功达成了液氧煤油火箭发动机领域的重大突破一日三试”壮举,此举标志着我国在新一代运载火箭主动力发动机的批产交付试验验证能力上迈上了新台阶,为长征系列火箭未来实现高密度发射任务奠定了坚实基础。1月19日9时43分、10时47分、12时06分,两台120吨级液氧煤油火箭发动机和一台18吨级液氧煤油火箭发动机分别进行了点火试车,试验取得圆满成功。通过这些努力,液氧煤油火箭发动机工艺验收试车的准备周期从原先的5天大幅缩减至2天,工作效率实现了质的飞跃,为我国新一代运载火箭主动力发动机的准时交付提供了强有力的支撑与保障。

  • 搭载RTX 5090显卡 联想新一代游戏本亮相:性能爆炸

    在CES2025盛会上,联想全新推出搭载英伟达RTX5090显卡的游戏本LegionPro7i。RTX5090拥有920亿个晶体管,可提供超3352TOPS算力,具有32GBGDDR7内存和1792GB/秒的高速带宽,拥有21760个CUDA核心。在游戏运行过程中,AIEngine通过智能场景检测技术,实时感知游戏的运行状态、系统负载以及玩家的操作行为等关键信息。

  • 微软Windows AI搜索上线!支持中文、自然语言就能搜

    微软面向Dev频道的WindowsInsider项目成员发布了适用于Windows11的KB5050083更新,版本号升至Build26120.2992。此次更新的一大亮点是全新的Windows11AIPC体验,尤其是对WindowsSearch搜索功能的大幅改善。用户可在设置”隐私和安全性”SearchingWindows”中调整可搜索的位置,或开启增强”以对全电脑搜索,未来,微软还将支持搜索存储在OneDrive等云存储提供商中的文档和照片。