首页 > 业界 > 关键词  > 字节跳动最新资讯  > 正文

字节跳动获得计算语言学会议ACL奖项

2021-08-06 16:23 · 稿源: 凤凰网科技

凤凰网科技讯8月6日消息,昨日,国际顶级学术会议ACL2021正式颁发“最佳论文”奖项,字节跳动AI Lab的机器翻译技术论文在3350篇论文投稿中脱颖而出,当选今年度“最佳论文”。这是ACL成立59年以来,华人科学家团队第二次赢得最高奖项,此前由中科院计算所主导的研究项目曾被评为ACL2019“最佳长论文”。

ACL大会由国际计算语言学协会主办,是自然语言处理与计算语言学领域最高级别的学术会议。自然语言处理被誉为“人工智能皇冠上的明珠”,在机器翻译、搜索、信息流、输入法等领域有着广泛的应用。

近年来ACL大会接收的投稿量持续上升,华人团队在该领域研究取得了举世瞩目的成绩,过去数年间曾获得“最佳长论文”、“最佳学生论文”和“杰出论文”奖项。今年除了字节跳动赢得最高荣誉,大会还评出了六篇“杰出论文”,香港中文大学与腾讯AI Lab的合作论文成功入选。

图:ACL2021公布“最佳论文”评选结果

字节跳动的获奖论文提出一种新的词表学习方案VOLT。词表是所有自然语言处理任务都会使用的基础组件,其作用就像人类查字典的索引。研究人员创新地把经济学和数学的知识运用到词表中:首先用“边际收益”定义了词表质量的评价指标,然后以“最优运输”的数学方法解决最优词表的生成问题,从而在多种翻译任务上取得出色的效果。VOLT研究项目现已向全球开发者开源。

ACL官方评审认为,“字节跳动的VOLT方案对机器翻译中一个重要问题提出了有效且新颖的解决方案,能显著减少词表的学习和搜索时间,相信其不仅会在研究界产生重要影响,在工业应用方面也有着巨大潜力”。

据悉,最佳论文研究成果将在字节跳动的火山翻译业务中逐步落地,为飞书、今日头条等产品和火山引擎的企业级客户提供机器翻译支持。2021年以来,火山翻译实现多项重要技术突破,研发出支持150个语种互译的大规模翻译模型mRASP2,并对外开源了当前业界最快的推理和训练引擎LightSeq2.0,以及端到端语音翻译工具包NeurST,获得开源社区的广泛好评。

在此前由ACL举办的机器翻译大赛WMT2021上,火山翻译以独创的“并行翻译”系统参赛,夺得德语到英语方向比赛自动评估第一名。“并行翻译”在国际赛事中首次亮相,就击败了从左向右逐词翻译的传统技术,打破后者在机器翻译领域的绝对统治地位,这项技术的论文也得到ACL2021大会收录。

举报

  • 相关推荐
  • 从品牌咨询到语言培训:小鹅通如何助力花花语言艺术实现培训产品数字化落地

    文章介绍小鹅通平台助力语言培训品牌“花花语言艺术”实现数字化转型的案例。创始人任瑞丽从品牌咨询转型,创立“母语应用式”培训体系,通过小鹅通完成产品数字化、私域运营等全链路升级,服务超1万用户。该案例体现了小鹅通以工具赋能为核心理念,帮助培训从业者实现业务可持续增长,未来将继续深化合作,完善表达训练体系并拓展文化传播领域。

  • 延续字节的红书梦,可颂找到新「钩子」

    最近一段时间,我们在日常刷抖音的过程中经常看到带有可颂链接的内容。这些内容往往会通过几张照片或一段视频向大家推荐某一地点的拍照姿势和拍摄角度,并告诉用户如何在可颂找到不同地点的最佳机位攻略。 以机位攻略这一更细的痛点为切口,可颂先解决了用户拍出更好看照片的需求,然后沿着从「工具到社区」的路径,重新找到了一条围绕本地生活场景构建种草社

  • 如何正确理解Token经济学?

    去年5月,当大模型厂商卷起价格战时,Tokens大概率是出镜率最高的英文单词。 简单来说,Tokens是大语言模型(LLM)用来切割自然语言文本的基本单位,可以直观的理解为“字”或“词”。 就像工业时代用“千瓦时”度量电力消耗,互联网时代用“GB”度量数据流量,AI时代用“Token”来度量模型的工作量。一个Token可以理解为一个词或词片段(中文里可能是一个字或词语)。

  • 字节跳动发布 Seedream 4.0 图像创作模型,豆包App可免费体验

    字节跳动Seed团队推出豆包图像创作模型Seedream4.0,支持文生图、图像编辑及多图参考等功能,在专业评测中达到业界领先水平。该模型已上线豆包App、即梦AI等平台供用户免费体验,并通过火山引擎开放给企业客户。Seedream4.0具备多模态创意能力,可生成4K分辨率商用图像,适用于教育、电商、广告设计等场景。团队表示将持续探索实时交互生成体验,深度融合多模态推理与世界知识。

  • 从边陲到前沿:麒麟软件推动新疆数字化与民族语言信息化

    1955年10月1日新疆维吾尔自治区成立,开启发展新篇章。70年来,新疆各族人民生活水平显著提升,社会事业全面进步,生态环境持续改善。麒麟软件作为国产操作系统核心力量,深度参与新疆数字化建设,覆盖党政、金融、交通、通信、教育等领域,支撑超70家厅局单位及14个地州市用户。其银河麒麟操作系统在维哈柯文等多民族语言版本持续升级,集成智能输入与AI助手,优化本地化体验,助力民族地区信息化发展。未来,麒麟软件将持续以技术创新服务新疆现代化建设,推动区域高质量发展。

  • 破解海外旅游语言困境,时空壶新T1以端侧模型开启全球畅行

    国庆假期临近,海外旅游热度攀升,语言沟通成为游客面临的主要障碍。网络不稳定更使依赖在线翻译工具的旅行者陷入困境。时空壶新T1翻译机通过端侧AI模型,实现无网或弱网环境下的流畅翻译,支持31种语言互译,覆盖全球98%主流旅游地。其离线翻译准确率达90%,响应迅速,并具备拍照翻译和降噪功能,有效解决机场、餐厅等嘈杂场所的沟通难题。新T1助力游客跨越语言壁垒,尽享无忧旅程,真正实现“无网也能畅行全球”。

  • AI日报:快手推出AI视频制作助手Kwali;字节跳动推出USO模型;OpenAI推出ChatGPT开发者模式

    本文介绍了AI日报栏目,聚焦AI领域最新动态。快手推出Kwali视频助手,简化视频制作流程;字节跳动发布USO模型,解决图像生成中风格与主题的矛盾;微软推出Copilot Audio音频模式,提供个性化语音交互;Stability AI升级Stable Audio 2.5,支持高质量音频生成;阿联酋推出开源大模型K2 Think,拥有320亿参数;微信上线智能回复功能,提升公众号运营效率;OpenAI推出ChatGPT开发者模式,支持AI控制外部工具;字节跳动Seed团队发布AgentGym-RL框架,提升语言模型决策能力;月之暗面开源Checkpoint Engine中间件,优化LLM推理效率;B站开源IndexTTS-2.0文本转语音系统,支持情感与时长控制;Replit推出Agent 3编程助手,自主性提升10倍。

  • AI日报:生数科技上线Vidu Q1参考生图;字节跳动发布Seedream4.0;百度文心大模型X1.1发布

    本期AI日报聚焦多项AI技术突破与应用进展。生数科技推出Vidu Q1参考生图功能,支持多图输入与一致性生成;字节跳动发布Seedream4.0多模态图像创作模型,推理速度提升10倍;腾讯推出国内首款全形态AI编程工具CodeBuddy,编码效率提升40%;百度文心大模型X1.1升级深度学习能力;OpenAI支持AI动画长片《Critterz》制作;上海AI实验室发布XTuner V1训练引擎提升效率20%;谷歌AI搜索新增5种语言支持;我国发布30项人工智能和15项人形机器人国家标准,推动行业规范化发展。

  • 微算法科技(NASDAQ MLGO)创新基于账户加权图与后量子密码学的区块链

    区块链技术凭借去中心化与全网共识机制展现巨大潜力,但单节点性能限制其交易处理能力,且量子计算威胁传统加密体系。微算法科技(MLGO)提出创新方案,通过账户加权图模型动态分片,结合格密码学提升并行处理与量子安全。该技术优化跨片通信,采用后量子签名算法,支持双链架构平滑过渡,在金融、供应链、元宇宙等场景实现高效扩展与隐私保护,为Web3.0奠定安全�

  • 2025 世界设计之都大会“创意可计算性:设计人工智能”,特赞升级五大内容+AI解决方案

    2025年9月25日至28日,上海将举办世界设计之都大会(WDCC2025),主题为“设计无界,生生不息”。大会聚焦人工智能赋能设计创新,探讨设计如何驱动产业与城市可持续发展。特赞科技作为内容与AI领域代表企业,将展示“计算×创意”如何拓展设计生命力,包括跨行业赋能、产教融合及人机协作三大板块,呈现AI在打破学科边界、推动产业创新中的实践。WDCC2025旨在为全球设计领域注入新动能,构建“设计×科技×可持续”的新想象空间。

今日大家都在搜的词: