首页 > 传媒 > 关键词  > 器人最新资讯  > 正文

腾讯云小微技术登顶榜单XTREME基准,跨语言技术迁移开发助力企业出海

2022-06-14 09:50 · 稿源: 站长之家用户

近日,腾讯云小微提出的多语言预训练模型“神农MShenNonG”以平均分85分的成绩登顶XTREME榜单。与此同时,该模型仅包含5亿级别的小参数量,也一举刷新业界纪录。

据了解,该榜单是目前最受国内外行业公司认可的多语言评测榜单,研究人员以多语言预训练模型在此榜单的表现作为其跨语言迁移能力的评价标准。

目前,全球有超过6900种语言,其中大多数语种都没有足够的数据支撑研究者将其单独训练成成熟模型。腾讯云小微深耕知识挖掘、语义理解技术以及预训练技术,“神农MShenNonG”此次登顶XTREME榜单,代表了其从单语言到多语言理解能力的一个显著扩展,将跨语言迁移开发由市场平均的月级降低至10天。同时,“神农”系列的预训练模型已应用于云小微全系列产品矩阵,可显著提升AI语音助手、智能客服机器人数智人等产品的多项技术指标,助力出海企业快速落地本地化服务。

刷新行业纪录,跨语言迁移开发周期缩短至10天

凭借对自然语言应用程序等领域发展研究的积极作用,XTREME榜单备受业界认可。

由于大多数的NLP预训练模型主要为中文、英文等高资源语种,低资源小语种的研究并未得到足够重视。2020年,来自 CMU、谷歌研究院和 DeepMind 的科学家们提出了覆盖四十种语言、横跨了12个语系的大规模多语言多任务基准 XTREME,其中包含了9项需要不同句法或语义层面进行推理的任务,并可以为语句文本分类、结构预测、语句检索和跨语言问答等自然语言处理任务提供有效支持。

此次登顶XTREME榜单,主要是由于“神农MShenNonG”在以下三个不同维度做了创新性的尝试。

首先,在数据层面,预训练模型的训练数据主要由两种形式的数据构成:单语种句子和双语平行句对。此前的模型处理方法是,对于单语种句子,单纯地将单语种信息输入模型,并以MLM作为训练目标,非常依赖相似语系之间“共享词”的预测来建模各语言间的语义对齐关系;对于平行句对,又依赖平行语料的规模和组合,模型对其对齐关系的建模存在一定缺陷。为缓解以上问题,腾讯云小微研究团队提出了基于混合编码的数据构造方式,分别利用双语对齐词典和句子检索工具,构造大量的“多语言混合”训练数据。

其次,在模型层面,研究团队提出了一种可插拔的、基于多尺度的多语言信息融合模块,分别从词级别和句子级别多个尺度融入多语言信息,期望在训练过程中,加强所有语种的词向量的更新和对齐,解决多语言模型对低资源语种、低频次词汇建模较弱的问题。

第三,在训练方式上,研究团队分别通过语种层面和语义层面引入对比学习策略,使得相同语义的表示相互拉近,不同语义的表示相互远离,进一步强化多语言预训练模型对于多语言的语义建模能力和语义匹配能力。

值得注意的是,研究团队重视多尺度的多语言的一致性建模,以强化预训练模型的跨语言迁移能力,并将跨语言迁移开发由市场平均的月级降低至周级,同时,相较市场平均1个月以上的模型迭代周期,“神农MShenNonG”仅需10天。

多次登顶权威榜单 神农以技术优势探索出海场景

“神农MShenNonG”登顶XTREME榜单,依托于腾讯云小微团队技术研发和行业知识的长期积累。此前,腾讯云小微的中文预训练模型ShenNonG就以十亿级参数量一举登顶CLUE总排行榜、1.1分类任务、阅读理解任务和命名实体任务四个榜单,刷新行业纪录。

专注于语义理解技术以及预训练技术的研发,此次登顶XTREME榜单代表了腾讯云小微从单语言到多语言理解相关技术的一个扩展。目前,“神农”系列的预训练模型已应用于全系列产品矩阵,可显著提升AI语音助手、智能客服机器人、数智人等产品的多项技术指标。

随着开发的不断成熟,优势产品向海外拓展成为不少国内企业的选择。但产品出海通常要面临适应新语种、业务本地化的挑战。过往,以机器翻译的方式将单语种迁移到多语言场景,不仅费时费力,效果也差强人意。相对于传统的机器翻译模式,腾讯云小微“神农MShenNonG”预训练模型有着低成本、低门槛的优势,以轻量参数为多行业、小语种提供跨语言迁移服务,助力企业降本增效,落地出海业务。

未来,腾讯云小微团队还将持续深耕知识挖掘和深度学习技术,探索更多技术落地场景,以科技助力各行业的企业更好地服务用户,为社会创造更多价值。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 从工具到数智中枢:DocuVerse云办公的生态价值与企业数智化未来

    飞天云DocuVerse云办公系统通过"ECM+AI"双轮驱动,将数字化工具从效率工具升级为企业"数智中枢"。其核心价值在于沉淀分散的员工经验、项目流程等数字资产,构建可复用的知识库,实现个人经验向组织能力的转化。系统突破传统文档管理局限,连接数据、流程与人员,支持快速接入第三方工具并兼容现有设备。产品兼顾中小企业快速部署与大型企业个性化需求,已服务教育、制造等多行业客户,推动企业内容管理从效率提升向价值创造跨越,成为数字化转型的可靠伙伴。

  • 微众银行深耕小微金融服务:微业贷解资金之渴 反诈教育筑安全之墙

    微众银行推出“微业贷”产品,为中小企业提供线上无抵押流动资金贷款,满足其“短、小、频、急”的融资需求。该产品具备材料少、放款快、额度高三大优势,累计服务超600万家企业,授信金额达1.7万亿元。同时,银行通过线下主题宣传活动普及融资安全与反诈知识,提升企业风险防范意识,增强对正规金融服务的信任。

  • 小鹏机器人会走猫步太像人了!小鹏发布新一代人形机器人IRON

    在第七届小鹏科技日上,小鹏汽车发布全新人形机器人IRON,其拟人化程度领先,拥有仿生脊柱、肌肉及柔性皮肤,配备3D曲面显示与灵巧双手,实现22个自由度。搭载3颗图灵AI芯片,算力达2250TOPS,支持对话、行走等智能交互,并采用全固态电池提升安全性。集成自研物理世界模型与VLT/VLA/VLM能力,实现环境感知与反馈。IRON将优先应用于商业场景,并与宝钢合作探索工业巡检。小鹏宣布开放SDK,邀请全球开发者共建机器人应用生态。

  • IT圈俱乐部走进玄武云,共探产业数智化新机遇

    2025年10月17日,“IT圈俱乐部走进玄武云”活动成功举办。活动汇聚行业专家与企业代表,通过产品展示、生态交流等环节,探讨产业数字化创新前景。重点展示了智慧U客等AI驱动解决方案,助力企业实现全流程智能化管理。各方就客户资源共享、技术协同达成多项合作共识。活动还组织参观了企业文化与智慧超市展区,实地体验行业AI应用成果。此次活动不仅是技术对接平台,更是构建协同产业生态的重要实践,未来玄武云将持续深化创新,为数字经济发展贡献力量。

  • 何小鹏回应机器人IRON里是真人质疑:感谢认可

    在第七届小鹏科技日上,小鹏汽车自主研发的人形机器人IRON首次亮相,其逼真步态引发网友惊叹“100%真人在里面”。面对质疑,董事长何小鹏以“感谢认可”巧妙回应,展现技术自信。IRON采用类人“骨骼-肌肉-皮肤”结构,搭载仿生肌肉驱动系统和22自由度拟态双手,能精准感知环境变化。团队历时7年研发,计划明年4月进入量产阶段。该机器人还融合物理世界模型体系,集成VLT/VLA/VLM三大核心能力,实现实时环境交互。此次展示既体现小鹏技术积累,也引发对科技真实性的思考。

  • 机器人“全能导航大脑”来了!银河通用发布NavFoM大模型

    银河通用发布全球首个跨本体全域环视导航基座大模型NavFoM,实现机器人从“学会完成导航任务”到“真正理解移动”的跨越。该模型支持全场景、多任务、跨本体应用,通过统一“视频流+文本指令→动作轨迹”范式,融合800万条跨任务导航数据,在真实机器人上实现零样本自主避障、路径规划等复杂任务。其技术突破将推动具身智能从单一功能进化为基础设施,为规模化商业落地奠定关键基础。

  • 何小鹏再回应机器人里藏真人质疑:现场展示内部结构

    小鹏公司研发的人形机器人IRON首秀后引发“真人操控”质疑。为回应舆论,董事长何小鹏不仅发布机器人脱衣视频,更在科技日现场剪开腿部覆盖件,直接展示内部仿生结构。该机器人搭载自研物理世界模型,融合三大核心能力,实现环境感知与实时反馈。目前IRON仍处科研阶段,计划明年4月量产,展现中国科技企业在机器人领域的创新实力。

  • 何小鹏:人形机器人进工厂不划算 做家务不安全

    今日,小鹏汽车发布旗下全新一代人形机器人IRON。 作为最拟人的人形机器人,IRON拥有骨骼-肌肉-皮肤”:仿人脊椎、仿生肌肉、全包覆柔性皮肤、头部3D曲面显示、仿生灵动双肩、实现22个自由度的灵巧手。 据何小鹏介绍,它的猫步走得像人一样轻柔,还拥有像人一样思考的大脑”,它不光是世界上最高算力的人形机器人,明年更会是最聪明的机器人之一。 现场,何小鹏还

  • 第三届数智交通创新发展大会|养路工数科书写公路安全“新答卷”

    在第三届中国数智交通创新发展大会论坛上,成都养路工数字科技公司作为承办方,系统剖析了公路养护行业痛点,提出智能化进阶路径:参考自动驾驶分级逻辑,从L1/L2辅助智能向L5完全智能演进。公司通过构建“全链路智能闭环”技术体系,突破空天地协同感知、轻量化巡检设备等关键技术,打造全周期数据底座,预计实现养护成本降低50%-90%。强调政产学研融合生态建设,未来将聚焦丰富智能养护矩阵、共建行业数据标准、推动公路数据要素化三大方向,以协同者姿态为行业高质量发展提供创新解决方案。

  • 马斯克称未来人类意识能上传至机器人 可用于月球和火星基地建设

    在2025年11月7日举行的特斯拉年度股东大会上,埃隆马斯克系统阐述了公司在人形机器人、自动驾驶、芯片研发与生产扩张等方面的战略规划,并更新了企业使命,展现出将技术愿景转化为现实应用的清晰路径。 马斯克指出,随着Neuralink等脑机接口技术的发展,人类有望在20年内实现将意识快照”上传至特斯拉人形机器人,使其具备类人意识。 人形机器人将被部署于月球与火�

今日大家都在搜的词: