首页 > 传媒 > 关键词  > 正文

快手主导研究成果SAMP入选人工智能顶会EMNLP2023

2023-12-15 14:49 · 稿源: 站长之家用户

  随着深度学习模型在自然语言处理等领域的广泛应用,模型推理速度和性能成为关键问题。近日,由快手主导的研究成果《SAMP:基于自适应混合精度的训练后量化模型推理库》成功入选该领域顶 级会议EMNLP 2023,并于新加坡现场展示和分享。

  该研究提出了一种名为SAMP的推理加速工具,通过自适应混合精度技术,在保持模型性能的同时,显著提高推理速度。其中包含自适应混合精度编码器和一系列先进的融合策略。自适应混合精度编码器可以在大量的通用矩阵乘法(GEMM)运算和Transformer层中找到最 佳浮点定点混合精度组合方式,使模型推理的性能最贴近用户需求(计算精度或推理效率)。最终,混合精度计算取得了比全定点计算更好的计算精度。融合策略对embedding算子和量化相关计算操作进行融合改进,使得 CUDA 内核调用减少一半。同时,SAMP是由C++编程语言实现的端到端工具包,具有出色的推理速度,也降低了训练后量化推理的工业应用门槛。

  表1:SAMP与同类系统相比的创新点

  SAMP具有以下几项主要亮点:

  1.自适应。SAMP 在训练后量化推理方法中平衡计算精度和延迟性能。用户可以针对不同的任务选择合适精度和推理延迟的混合精度配置。SAMP还可通过自适应分配方法推荐给用户最 佳的量化组合模式。

  2.推理效率。在较宽的精度范围(浮点到定点)中,SAMP 显示出比其他推理工具包更好的推理加速。在中文语言理解测评基准(CLUE)分类任务数据集中,与FasterTransformer相比,SAMP实现了高达1.05-1. 15 倍的加速。

  3.灵活性。SAMP 涵盖众多下游任务,如分类、序列标记、文本匹配等。 Target 模块是可扩展的并且可以灵活定制。它对用户友好且对平台依赖性较低。 SAMP 支持 C++ 和 Python API,仅需要 CUDA 11.0 或更高版本即可。 另外,SAMP也提供了许多模型转换工具,支持不同格式模型之间相互转换。

  图1:该论文在EMNLP2023 现场展示和分享

  主要研究者来自快手的田荣表示,能在模型推理这样的场景下取得佳绩是整个团队共同努力的结果,SAMP的贡献主要在三个方面,首先是解决了现有后量化(PTQ)推理工具在工业应用中精度损失大的问题;第二是推动了后量化(PTQ)技术在 NLP 多个下游任务中大规模使用;同时,该推理库还有轻量、灵活,对用户友好的特点并支持用户自定义任务目标。

  据悉,EMNLP(Empirical Methods in Natural Language Processing)是自然语言处理和人工智能领域的顶 级国际会议之一,聚焦于自然语言处理技术在各个应用场景的学术研究,尤其重视自然语言处理的实证研究。该会议曾推动了预训练语言模型、文本挖掘、对话系统、机器翻译等自然语言处理领域的核心创新,在学术和工业界都有巨大的影响力,此次入选也意味着快手在该领域的研究成果获得了国际学者的认可。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • AI赋能| 2025“人工智能+行动”大讲坛在上海圆满成功

    2025年5月18日,"人工智能+行动"高峰论坛在上海成功举办。活动聚焦"技术+场景+人才"三大核心,汇聚政产学研界500余位精英,探讨AI在八大领域的创新应用。论坛发布DS&AI创新院2.0版,推出"三包"赋能计划:资源包共享30余位专家智库,技术包提供定制化AI解决方案,人才包培养2000+AI专业人才。多位专家指出,中国正从AI"跟跑者"跃升为全球"领跑�

  • “AI赋智 端云共生”中兴通讯亮相2025全球人工智能终端展

    2025年5月22-24日,中兴通讯终端业务以"AI赋能,端云共生"为主题亮相第六届深圳国际人工智能展。重点展示了多款AI终端产品:努比亚Z70S Ultra摄影师版搭载第五代35mm定制镜头,支持多模型协同;二合一云PAD PRO具备平板/电脑双系统;中兴自由屏实现多场景智能切换。基于"AI for All"战略,中兴构建了覆盖智能驾驶、家庭娱乐等五大场景的智慧生态,通过星云大模型�

  • 姜钧凯:人工智能已经驱动硬件体系大变革

    爱国者集团CEO姜钧凯在2025中国人工智能产业领军论坛上指出,人工智能正推动硬件体系大变革。他回顾30年科技发展规律:每十年软硬件互相促进一次飞跃,从1993年电脑硬件、2003年数码产品到2013年智能穿戴,再到2023年后AI大模型兴起。姜钧凯透露,科学家正在研发基于金刚石芯片和碳基存储的新一代硬件系统,其中同位素电池技术尤为突破——采用碳14同位素衰变原理,可实现百年免充电,且安全无辐射。爱国者已布局强人工智能软硬件体系,包括居家养老系统、数据清洗平台及以金刚石芯片为核心的硬件研发。姜钧凯预测2056年将迎来超级人工智能时代,人类只需从事创造性活动。论坛上,爱国者还展示了针对自闭症儿童的水晶疗愈等创新应用。多位科学家高度评价爱国者对中国科技发展的贡献。(宋洁凡)

  • 倍孜网络CEO聂子尧主持虎啸盛典AI论坛并发布《2025中国数字营销行业人工智能应用趋势研究报告》

    本文聚焦AI营销创新,重点呈现了2025虎啸盛典上发布的《中国数字营销行业人工智能应用趋势研究报告》核心内容。报告指出AI营销正从效率工具向价值引擎跃迁,倍孜网络CEO聂子尧提出AI应释放人类潜能而非替代创造力。报告展示了三大趋势:1)技术融合:AIGC+元宇宙+Web3协同创新;2)行业重构:AI深度赋能金融、零售、快消领域;3)战略升级:数据资产化与算法进化。典型案例包括12306智能投放系统提升触达精准度,可口可乐"未来3000年"跨模态营销实现189万次用户互动。报告强调AI营销需警惕"幻觉效应",应通过"模法"建立可持续的智能营销生态。

  • 阿里云携手博登智能,升级AI数据标注服务——以数据驱动人工智能

    博登智能与阿里云达成战略合作,共同推动AI数据标注智能化发展。博登智能自主研发的BASE平台通过AI技术实现数据标注自动化,最高提升600%效率,降低成本40%,已服务自动驾驶、智慧医疗等领域。双方将结合博登的数据服务优势与阿里云的技术实力,构建从数据采集到模型训练的全流程解决方案,推动AI技术在千行百业落地。此次合作将加速数据智能服务升级,让更多企业以更低门槛拥抱AI技术。

  • 师出有名:华城瑞讯首创人工智能平台 共建数智企服生态

    华城瑞讯创始人高瑞先拜访中国中小企业协会,双方围绕小微企业数智化服务、企服咨询师行业标准建设等议题展开交流。协会成立于2006年,致力于服务中小企业发展。华城瑞讯自主研发的"22°智·企服"Agents系统获高度认可,其融资服务模块可将融资周期缩短60%,成本降低50%。公司计划推出企服咨询师培训计划,建立OMO服务模式,整合银行、律所等专业资源。目前"22°智·融资"Agent已促成近20个千万级融资项目落地,覆盖智能制造、数字科技等领域。未来将共建数智企服新生态,在全国重点城市增设服务空间,助力小微企业在数字经济浪潮中实现跨越式发展。

  • 手机满意度跌至 10 年来的最低水平,AI人工智能只是部分原因

    手机用户的整体满意度从去年的 82% 降至 78%。乍一看似乎只是小幅下降,但这其实是 近十年来的最低分,而去年还创下了历史最高纪录……

  • vivo出席博鳌亚洲论坛国际科技与创新论坛2025年香港会议,让人工智能赋能全民福祉

    6月6日至7日,博鳌亚洲论坛国际科技与创新论坛2025年香港会议在香港会议展览中心举行。vivo副总裁周围出席"从互联网+到人工智能+"分论坛,探讨AI智能化变革趋势。周围指出,AI将成为世界级基础设施,手机作为AI应用的重要载体,是连接技术与普通人的桥梁。vivo将持续深耕手机智能领域,构建大语言模型等核心能力,并推动AI在影像、办公等场景的应用落地。同时vivo将联合汽车、医疗等行业构建智能生态,特别关注无障碍领域的技术普惠。作为论坛战略合作伙伴,vivo将持续分享创新成果,展现中国科技实力与人文温度。

  • GAITC2025全球人工智能技术大会 | 每日互动方毅:开源大模型+闭源小数据是AI时代的重要路径

    文章探讨了"人工智能"更应称为"人造智能",对应"神造智能"的概念。作者指出AI模拟了神造智慧过程中的规律,人类可从AI身上重新学习"神"的智慧。通过三种棋类游戏分析AI发展:五子棋代表专注规则,深蓝代表深度思考,AlphaGo代表强化学习。数据是AI的重要命脉,需通过可信数据空间转化使用。AI已在交通安全、医疗健康、反诈宣传等领域带来改变,如高速视觉AI检测、脑卒中早筛模型等。未来最重要的是个人知识库和提问能力,人类需学会驾驭AI而非被其取代,2%的人将成为定义问题的深度思考者,98%则是幸福生活者。技术应成为托举大众的方舟而非割裂世界的鸿沟。

  • 广电视听人工智能联合共建实验室成立,共筑智慧媒体发展新引擎

    5月22日,国家广播电视总局广播电视规划院、贵州多彩新媒体股份有限公司与腾讯云等联合成立"广电视听人工智能联合共建实验室",旨在推动AI技术与广电视听产业深度融合。实验室汇聚全国十余家省级广电新媒体单位及头部科技企业,聚焦机器学习、自然语言处理、计算机视觉等前沿技术领域,致力于技术突破、人才培养和产业升级。该实验室将作为"智慧广电"建设的重要创新平台,通过跨领域资源整合,构建开放创新生态,推动从内容生产到终端服务的全链条智能化升级,助力广电行业构建更高效、更智能的传播生态。