首页 > 业界 > 关键词  > 机器学习最新资讯  > 正文

微软翻译迎来Z-code专家混合模型更新 显著增强翻译服务质量

2022-03-23 11:00 · 稿源: cnbeta

微软刚刚宣布了自家翻译服务的一项更新,为用户引入了新的机器学习技术,有望显著改善多语种之间的翻译质量。具体说来是,基于“备用专家混合”(spare Mixture of Experts)方案的 Project Z-Code 项目,可让新模型在盲测评估中的得分较以往提升 3~15% 。

0.jpg

(来自:Microsoft Research Blog)

据悉,Z-code 是微软更广泛的 XYZ-Code 计划的一部分,着眼于结合多种语言的文本、视觉和音频模型,以创建更强大、实用的 AI 系统。

虽然“专家组合”并不是一套新颖的技术,但它在翻译环境中还是相当实用。该系统的核心,本质上是将任务分解为多个子任务,然后将之委托给更小、更专业的所谓“专家”模型。

1.gif

Z-code MoE 模型示例:从英语翻译成法语时,可为每个输入动态选择其参数的子集。

各个模型会根据自身特性来预测、并决定将哪个任务委派给哪个专家,从而极大地简化了开发思路。对于普通用户来说,你可将之视作包含多个更专业模型的大模型集合。

微软技术研究员兼 Azure AI 首席技术官黄学东表示:借助 Z-code,我们确实取得了惊人的进步。

我们正在利用迁移学习和多任务学习,以从单语言和多语种数据中创建一个极具质量和性能的最佳组合。

最终带来一个最先进的语言模型,并为客户带来高效的体验。

2.jpg

结果是,我们看到了一套全新的系统,现能够直接在 10 种语言之间进行翻译,从而消除了对多个系统的需求。

此外微软最近还开始使用 Z-code 模型来改进其 AI 系统的其它功能,包括实体识别、文本摘要、自定义文本分类、以及关键词提取,但将其用到自家翻译服务上还是首次。

传统意义上的翻译模型相当笨拙,因而很难将其带入生产环境。不过微软团队选择了一套“稀疏”方案 —— 仅激活每个任务的少量模型参数、而不是动辄调用整个系统。

这使得模型的运行更具成本效益,就像仅在冬日里为最常用的时段和空间提供室内加热一样经济高效,而无需让暖炉一直保持全速运转。

举报

  • 相关推荐
  • AI日报:美团No Code平台免费开放;豆包App升级“一句话P图”功能;苹果Xcode 26内置ChatGPT等AI功能

    本文介绍了AI领域多项重要进展:1)美团推出No Code平台和1680个AI应用;2)豆包App升级"一句话P图"功能;3)苹果发布内置ChatGPT的Xcode26开发工具;4)iOS26新增视觉智能功能;5)讯飞星火X1升级版即将发布;6)比亚迪接入阿里通义大模型;7)DeepSeek支持本地工具调用;8)开源框架Rowboat支持快速构建智能助手;9)X平台整合Grok AI优化内容推荐;10)港科大开发进化搜索技术提升小模型图像生成能力;11)硅基流动完成数亿元融资;12)港大与英伟达合作开发新型视觉注意力机制。这些创新展示了AI技术在各领域的快速发展和应用突破。

  • @开发者们:百度文心大模型4.5系列模型开源,国内首发平台GitCode现已开放下载!

    6月30日,百度文心大模型4.5系列正式开源并在国内领先的开源平台GitCode首发上线。该系列包含10款模型,涵盖47B和3B参数的混合专家(MoE)模型及0.3B的稠密参数模型,采用创新的多模态异架构结构实现跨模态知识融合。模型基于飞桨框架开发,训练效率达47% MFU,在文本和多模态基准测试中达到SOTA水平。所有模型按Apache2.0协议开源,配套产业级开发套件支持多种芯片部署。GitCode平台已汇聚620万用户,为AI开发者提供代码托管、协同开发等全流程支持。此次开源将推动中国AI生态创新,加速大模型技术产业化应用。

  • 当机器拥有“大脑”——讯飞双屏翻译机 2.0在嘈杂场景也能“耳聪译明”

    文章探讨了全球化背景下跨语言沟通面临的"鸡尾酒会问题"——在嘈杂环境中精准捕捉目标语音的难题。讯飞双屏翻译机2.0通过硬件创新(五麦克风星型阵列)和算法突破(注意力机制模拟人类听觉系统),实现了复杂场景下的语音降噪和定向拾取。该技术突破使翻译设备从"被动接收"进化为"智能倾听",能够主动理解声学环境并做出决策,真正解决了用户在展会、工厂等嘈杂场景中的核心痛点。这不仅标志着翻译技术的进步,更预示着人机协同感知时代的到来——让每个声音都被精准听见,每次沟通都充满效率与温度。

  • 微信鸿蒙版1.0.8.16邀测大版本更新:新增扫一扫翻译、发表视频号等9大功能

    日前,微信鸿蒙版开启1.0.8.16版本邀测升级,本次新增9大新功能,算是一次大版本更新了。 邀测需收到短信通知后点击链接跳转安装,无法主动下载安装。 具体更新如下: 1、音视频通话支持在后台小窗显示 2、完善群管理功能 3、支持设置拍一拍文案

  • 演讲也能翻译!时空壶X1同声传译器赋能跨国企业

    时空壶X1同声传译器是全球首款独立同传翻译终端,基于Babel+OS巴别系统打造,支持20人5种语言实时同传交流。其突破性功能包括:1)演讲翻译功能,支持大型跨国活动多语言实时转译;2)智能降噪技术确保嘈杂环境下的翻译准确性;3)95%专业术语翻译准确率,覆盖40种语言和93种口音;4)智能组网功能可快速构建百人规模会议网络。该设备已广泛应用于跨国企业会议、商务洽谈、产品发布会等场景,显著提升沟通效率,重塑全球商务交流新格局。

  • 暑期海外游,无惧网络环境!时空壶新T1首次实现“真离线”翻译

    随着暑期旅游旺季到来,海外游客面临语言不通和网络信号不稳定两大难题。时空壶T1翻译机创新性地内置AI大模型,实现真正离线翻译,在无网络环境下仍能提供优质翻译体验。其支持31种语言互译,覆盖全球98%主流旅游地,离线翻译准确率高达90%,大幅领先行业水平。T1还具备拍照翻译、实时汇率换算、紧急求助等实用功能,并内置eSIM卡提供两年全球免费流量。这款翻译机彻底解决了海外旅游中的语言障碍,让游客能畅享异国旅程。

  • 我们跟美团技术的同学聊了聊“NoCode”的背后,顺手用它搭了个社区……

    ​我不是一个“懂代码”的人。 作为一家日益专注AI的科技内容社区的CEO,我的团队与AI 创业者和研究人员进行访谈,发布文章,举办各种各样的AI 论坛、黑客马拉松和workshop;我还在硅谷成立了一个 叫GenAI Assembling的AI 开发者社区,定期举办线下活动和闭门讨论。 我们不仅有读者,还有社区用户,这意味着我们有大量的前端交互页面需要生成——AI 从业者和爱好者需要点击它

  • 真AI翻译耳机来了,金运灵动环A9耳机重塑跨语言交流新体验

    金运灵动环A9耳夹式耳机通过AI大模型技术颠覆传统翻译设备,实现百种语言实时互译,0.7秒极速响应,准确率达98%。产品突破四大翻译困境:解决传统工具延迟高(1.5秒)、专业术语误译(准确率仅80%)、操作繁琐(72%用户放弃深度沟通)、功能单一等问题。其创新骨传导技术实现"耳听即译"的无缝体验,支持会议录音转写、AI写作辅助等扩展功能,以百元价位提供千元级专业翻译设备的性能。对比传统翻译器,该产品将翻译延迟降低20%,误译率控制在0.3%,且重量仅5克,解放用户双手。典型案例显示,用户与外国客户沟通时,设备能精准处理专业术语和俚语(如将"炸鸡啤酒"关联韩剧文化梗)。产品重新定义智能翻译标准,让跨语言交流从"手动操作"进化为"自然对话",证明科技普惠的本质是让高端功能触手可及。(140字)

  • AI日报:腾讯混元3D 2.1大模型开源;字节跳动AI Lab负责人李航卸任;OpenAI Codex 全新升级

    本文介绍了AI领域最新动态:1)腾讯开源混元3D2.1大模型,提升3D生成质量;2)OpenAI Codex升级,优化代码生成功能;3)字节跳动AI Lab负责人李航卸任;4)微软发布700个AI应用案例;5)微软推出Code Researcher工具,解决58%系统崩溃问题;6)Observer AI实现屏幕操作自动化;7)Genspark发布AI浏览器;8)麻省理工用AI技术3.5小时修复15世纪名画;9)蚂蚁集团推出开源多模态GPT-4o模型Ming-Omni;10)MagicTryOn视频换衣框架;11)字节跳动发布实时互动AI视频生成模型Seaweed APT2;12)ChatGPT搜索功能升级;13)字节跳动与老凤祥合作开发AI智能眼镜。

  • 企业如何安全应用DeepSeek?Gartner®推荐采用云厂商模型即服务(MaaS),腾讯作为云服务提供商之一被报告提及

    Gartner最新报告《如何安全使用DeepSeek》指出,企业在部署和应用DeepSeek大模型时需注意潜在安全风险,包括未授权访问、数据泄露等六大风险领域。报告建议预算有限的企业优先选择主流云服务商提供的MaaS(模型即服务)方案,腾讯云等具备完善安全机制的云厂商被重点推荐。对于私有化部署的企业,必须具备专业安全团队和长期运营能力。报告强调,随着生成式AI应用普及,企业需借助AI安全态势管理工具(AI-SPM)持续监测模型和数据安全状态。腾讯云依托成熟的安全架构,可提供企业级安全功能整合和合规保障,帮助客户应对AI应用带来的安全挑战。