首页 > 传媒 > 关键词  > 器人最新资讯  > 正文

腾讯云小微技术登顶榜单XTREME基准,跨语言技术迁移开发助力企业出海

2022-06-14 09:50 · 稿源: 站长之家用户

近日,腾讯云小微提出的多语言预训练模型“神农MShenNonG”以平均分85分的成绩登顶XTREME榜单。与此同时,该模型仅包含5亿级别的小参数量,也一举刷新业界纪录。

据了解,该榜单是目前最受国内外行业公司认可的多语言评测榜单,研究人员以多语言预训练模型在此榜单的表现作为其跨语言迁移能力的评价标准。

目前,全球有超过6900种语言,其中大多数语种都没有足够的数据支撑研究者将其单独训练成成熟模型。腾讯云小微深耕知识挖掘、语义理解技术以及预训练技术,“神农MShenNonG”此次登顶XTREME榜单,代表了其从单语言到多语言理解能力的一个显著扩展,将跨语言迁移开发由市场平均的月级降低至10天。同时,“神农”系列的预训练模型已应用于云小微全系列产品矩阵,可显著提升AI语音助手、智能客服机器人数智人等产品的多项技术指标,助力出海企业快速落地本地化服务。

刷新行业纪录,跨语言迁移开发周期缩短至10天

凭借对自然语言应用程序等领域发展研究的积极作用,XTREME榜单备受业界认可。

由于大多数的NLP预训练模型主要为中文、英文等高资源语种,低资源小语种的研究并未得到足够重视。2020年,来自 CMU、谷歌研究院和 DeepMind 的科学家们提出了覆盖四十种语言、横跨了12个语系的大规模多语言多任务基准 XTREME,其中包含了9项需要不同句法或语义层面进行推理的任务,并可以为语句文本分类、结构预测、语句检索和跨语言问答等自然语言处理任务提供有效支持。

此次登顶XTREME榜单,主要是由于“神农MShenNonG”在以下三个不同维度做了创新性的尝试。

首先,在数据层面,预训练模型的训练数据主要由两种形式的数据构成:单语种句子和双语平行句对。此前的模型处理方法是,对于单语种句子,单纯地将单语种信息输入模型,并以MLM作为训练目标,非常依赖相似语系之间“共享词”的预测来建模各语言间的语义对齐关系;对于平行句对,又依赖平行语料的规模和组合,模型对其对齐关系的建模存在一定缺陷。为缓解以上问题,腾讯云小微研究团队提出了基于混合编码的数据构造方式,分别利用双语对齐词典和句子检索工具,构造大量的“多语言混合”训练数据。

其次,在模型层面,研究团队提出了一种可插拔的、基于多尺度的多语言信息融合模块,分别从词级别和句子级别多个尺度融入多语言信息,期望在训练过程中,加强所有语种的词向量的更新和对齐,解决多语言模型对低资源语种、低频次词汇建模较弱的问题。

第三,在训练方式上,研究团队分别通过语种层面和语义层面引入对比学习策略,使得相同语义的表示相互拉近,不同语义的表示相互远离,进一步强化多语言预训练模型对于多语言的语义建模能力和语义匹配能力。

值得注意的是,研究团队重视多尺度的多语言的一致性建模,以强化预训练模型的跨语言迁移能力,并将跨语言迁移开发由市场平均的月级降低至周级,同时,相较市场平均1个月以上的模型迭代周期,“神农MShenNonG”仅需10天。

多次登顶权威榜单 神农以技术优势探索出海场景

“神农MShenNonG”登顶XTREME榜单,依托于腾讯云小微团队技术研发和行业知识的长期积累。此前,腾讯云小微的中文预训练模型ShenNonG就以十亿级参数量一举登顶CLUE总排行榜、1.1分类任务、阅读理解任务和命名实体任务四个榜单,刷新行业纪录。

专注于语义理解技术以及预训练技术的研发,此次登顶XTREME榜单代表了腾讯云小微从单语言到多语言理解相关技术的一个扩展。目前,“神农”系列的预训练模型已应用于全系列产品矩阵,可显著提升AI语音助手、智能客服机器人、数智人等产品的多项技术指标。

随着开发的不断成熟,优势产品向海外拓展成为不少国内企业的选择。但产品出海通常要面临适应新语种、业务本地化的挑战。过往,以机器翻译的方式将单语种迁移到多语言场景,不仅费时费力,效果也差强人意。相对于传统的机器翻译模式,腾讯云小微“神农MShenNonG”预训练模型有着低成本、低门槛的优势,以轻量参数为多行业、小语种提供跨语言迁移服务,助力企业降本增效,落地出海业务。

未来,腾讯云小微团队还将持续深耕知识挖掘和深度学习技术,探索更多技术落地场景,以科技助力各行业的企业更好地服务用户,为社会创造更多价值。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • AI钉铛智造全新发布“钉铛云AI OS”,为制造业数智化转型注入新动能

    红壹科技在第二十届中博会期间发布“钉铼云AI OS”工业操作系统,该系统采用“一体·双翼·三擎”架构,整合AI与工业数字化能力,聚焦中小企业智能制造痛点。已服务全国50余个制造业核心城市的上万家企业,通过AI智能预测、工艺优化等功能显著提升生产效率,降低运营成本。公司核心团队来自阿里、华为等头部企业,致力于构建开放协同的工业生态,助力中国智造走向全球。

  • “与智同行,共启新元”智元机器人首届合作伙伴大会暨 “IT老友会走进智元机器人”系列活动圆满举办

    2025年8月21日,智元机器人在上海成功举办首届合作伙伴大会,主题为“与智同行,共启新元”。大会同步开展“IT老友会走进智元机器人”系列活动,汇聚多领域精英探讨具身智能机器人技术边界与产业生态构建。活动展示超100台智能机器人,呈现工业智造、商业服务等多场景应用实效,并深入交流技术突破与产业布局,加速推动智能机器人在各领域的规模化商用与生态发展。

  • 北电数智亮相世界人工智能大会,“四链融合”推动AI产业落地

    2025世界人工智能大会“人工智能+”战略领军人才与创新发展论坛圆满落幕。论坛聚焦“人才领航智启未来”主题,汇聚中科院、社科院专家及中国联通、腾讯云等机构代表,围绕“人工智能+”行动分享经验,为AI高质量发展筑牢人才根基、激发创新动能。北电数智CMO杨震出席并发表演讲,分享AI行业落地实践,强调紧跟国家战略,推进产业、创新、人才、资本四链融合,打造面向不同场景的AI解决方案,全方位助力AI产业发展。

  • 重识vivo:做MR和家用机器人的隐性逻辑

    尽管苹果Vision Pro在发布一年后,市场表现并不如其它同门那样好,但2024年它仍以3499美元的高价拿下全球5.2%的市场份额,紧随Meta和索尼之后。 当然重要的不是份额,而是苹果对于空间计算的引领,以及对于智能头显市场的推波助澜。 IDC预计,在软硬件技术革新、AI大模型快速发展、交互技术进一步融合的趋势下,2025年全球智能头显市场出货量将同比增长26%至1280万台,其中�

  • 从经验驱动转向智能驱动,AI为企业数智化转型注入新动能

    传统企业决策依赖管理者经验与直觉,存在主观性、信息不全面、数据处理滞后等问题,常导致决策偏差。人工智能技术通过大数据分析与智能算法,推动决策从“经验驱动”转向“数据驱动”,提升精准度与效率。启信慧眼等工具整合多维度数据,构建智能决策系统,助力企业规避风险、捕捉机遇,实现科学高效的数字化转型。

  • 世界机器人大会|远东股份助力机器人产业实力出圈

    2025世界机器人大会在北京落幕,标志着人形机器人产业迎来历史性跨越。以优必选Walker S2为代表的中国整机产品展现出前所未有的实用潜力,其突破性技术实现了机器人运行的"柔性神经"。远东南缆等企业构建的国产核心零部件产业链为行业发展提供关键支撑。大会汇聚200余家企业1500件前沿展品,其中100余款全球新品集中亮相,勾勒出机器人深度融入人类生活的图景。从2024年"概念元年"到2025年"落地打工",产业正加速从实验室走向实际应用。远东南缆研发的机器人专用线缆实现千万次弯折寿命,通过材料创新赋予电缆卓越柔韧性,其专项实验室获CNAS国家认证,为产品可靠性保驾护航。随着AI技术发展,机器人群体智能将推动生产效率跃升,具备综合优势的国产供应商正迎来前所未有的市场机遇。

  • 极速、可靠、灵活|移动云以云硬盘为前沿技术落地提供有力支撑

    2025年4月,第十八届中国电子信息年会在成都成功召开。移动云举办“AI时代先进存力:构建新型数据存储前沿基础设施”论坛,聚焦AI大模型应用下数据存储、处理及算法框架的高要求。论坛探讨了存储技术、架构和安全创新,旨在推动存储技术发展,构建先进可靠的存力基石。移动云推出极速型云硬盘等产品,满足高IOPS、低延迟需求,并全面接入国产大模型DeepSeek,降低技术门槛,助力用户实现智能化升级。通过完善产品矩阵,满足多元业务场景需求,为千行百业数字化转型提供高质量存储保障。

  • 顺丰亮相亚宠展,数智物流解决方案助力宠物产业高效发展

    8月20日,第二十七届亚洲宠物展览会在上海开幕。顺丰作为行业领先企业,展示了其数字化物流解决方案,包括智能仓储、智慧物流等最新方案。针对宠物食品时效性、安全性需求提升,顺丰构建全国仓配生态体系,提供高效履约服务,并优化末端配送网络,助力宠物产业升级。未来,顺丰将持续关注行业趋势,迭代服务能力,推动宠物产业发展。

  • 打造智慧旅游新范式,移动云推动旅游业向新而行

    我国旅游业近年来爆发式增长,但面临景区管理效率低、服务质量参差不齐等问题。为此,国家发布多项规划推动智慧旅游建设,以数字化、网络化、智能化提升管理效能和服务水平。移动云等企业通过云计算、大数据、人工智能等技术,打造一站式解决方案,助力景区实现精细管理、精准服务和智能营销,推动旅游业数字化转型,释放文旅资源潜力。

  • AI日报:智谱AI发布AutoGLM 2.0;腾讯元宝接入腾讯视频;字节发布开源大语言模型 Seed-OSS

    本期AI日报聚焦多项AI技术突破:智谱发布革命性语音代理AutoGLM 2.0,实现全平台语音操控;腾讯元宝接入视频平台提升观影便捷性;字节跳动开源大模型Seed-OSS专注长文本处理;速卖通AI代理助力新品推广效率翻倍;微软测试Copilot智能文件搜索功能;Liquid AI推出低延迟视觉语言模型LFM2-VL;OpenAI月收入首破10亿美元;谷歌Pixel 10系列全面升级AI功能,包括情感识别和实时翻译;Pixel Buds Pro 2引入AI手势控制;ElevenLabs发布支持70+语言的文本转语音API。

今日大家都在搜的词: