首页 > AI头条  > 正文

DeepSeek下一代技术获ACL2025最佳论文奖,长文本处理效率提升11倍!

2025-07-31 09:16 · 来源: AIbase基地

在刚刚结束的 ACL2025颁奖典礼上,由 DeepSeek 的梁文锋博士作为通讯作者,与北京大学等机构联合发表的研究论文荣获最佳论文奖。这次会议规模空前,投稿数量几乎翻倍,达到了8360篇,竞争之激烈可见一斑。

该论文提出了一种名为原生稀疏注意力(NSA)的新机制,能在算法与硬件的协同优化下,将长文本的处理速度提升至惊人的11倍。而更为振奋的是,这项技术的性能不仅提升,反而超越了传统的全注意力模型。通过这项技术,研究团队成功将上下文长度扩展到了惊人的100万 tokens,这为未来的前沿模型奠定了基础。

image.png

NSA 机制的核心在于通过动态分层的稀疏策略,结合三条并行的注意力分支,有效捕捉文本中的重要信息。首先是 “压缩注意力”,负责提炼全局信息;其次是 “选择性注意力”,聚焦于重要的词块;最后是 “滑动注意力”,确保局部上下文的完整性。这种设计不仅让模型更为灵活,同时在现代 GPU 硬件上进行了深度优化,实现了原生可训练模式。

image.png

在测试中,NSA 在处理64k 长度的文本时,解码阶段速度提升了11.6倍,前向传播和反向传播速度分别提升了9倍和6倍。更重要的是,NSA 在各种基准测试中表现优异,27B 参数的模型在9个评测指标中有7个超越了全注意力基线,特别是在多跳问答和代码理解等复杂任务中展现了明显的优势。

image.png

这项研究为长文本处理开辟了新的可能性,真正实现了速度与精度的双赢,证明了 NSA 机制在 AI 领域的广泛应用前景。

论文地址:https://arxiv.org/pdf/2502.11089

  • 相关推荐
  • 百度智能云这项开源,让 DeepSeek-V3.2 推理服务吞吐提升 2 倍

    10月28日,百度智能云联合SGLang社区开源针对DeepSeek-V3.2优化的多token预测(MTP)技术代码。该技术通过批量生成和集中验证机制,使模型解码吞吐量提升超2倍,突破传统自回归解码的序列化瓶颈。此次开源的MTP方案已完成与DeepSeek-V3.2稀疏注意力架构的深度适配,并经过百度内部业务验证,开发者可"开箱即用"获得稳定可靠的推理加速能力。

  • DeepSeek开源3B OCR模型:长文本识别达97%精度

    DeepSeek在GitHub开源新一代OCR模型,采用创新光学二维映射压缩技术,在长文本识别场景实现97%准确率。模型通过动态压缩生成最优视觉特征令牌,较传统方法减少60%计算冗余。实验显示在1:20压缩率下仍保持60%以上准确率,显著优于同类模型。该技术路径为OCR系统小型化提供解决方案,其动态压缩策略对大型语言模型的记忆管理机制具有重要启示。

  • 信锐助力TCL获 “2025中国IDC未来企业大奖联接领军者”优秀奖!

    10月17日,TCL空调办公网络智能连接与体验升级项目在IDC中国CIO峰会获“2025未来企业连接领军者”优秀奖。该项目依托信锐“AI+网络自动驾驶”理念,通过全网智能2.0与小信GPT方案重构企业网络管理模式,实现从感知、分析到决策的智能闭环,助力TCL实现20+维度数据采集、7*24小时AI调优及自然语言交互运维,推动企业数字化转型升级。

  • DeepSeek崩了上热搜 页面显示“服务器繁忙”

    截至2025年11月3日,大量用户在微博话题#DeepSeek崩了#下集中反馈,DeepSeek平台出现服务异常状况,引发广泛关注。综合各方信息,此次故障呈现多方面表现,对用户使用造成显著影响。 众多用户表示遭遇服务全面中断问题,在尝试使用平台

  • ​你的品牌在豆包、DeepSeek里搜不到?这份GEO品牌监控攻略,3步把曝光拉满

    GEO指数是AI搜索时代的品牌可见度衡量指标,量化品牌被AI引用、推荐和对比的频率与深度。与传统SEO比拼搜索排名不同,GEO衡量的是品牌在AI回答中的提及率和好感度。数据显示,高GEO指数品牌在AI搜索中的转化率是传统SEO的3.4倍。文章通过案例说明,企业可通过监控竞品差距、补充缺失内容关键词、优化AI提示词等策略提升GEO指数。建议立即使用AIBase平台免费体验GEO监控,把握AI搜索新机遇。

  • GEO指数解读:衡量AI搜索曝光的下一代指标体系

    本文探讨AI搜索时代如何衡量品牌可见度。传统SEO指标在AI搜索中失效,提出GEO指数四大维度:曝光频率(品牌被提及次数)、推荐排名(在AI推荐中的位置)、曝光场景(问题与品牌匹配度)、竞品对比(与竞争对手的曝光差距)。建议通过监控核心问题、建立基线数据、定期追踪变化来优化内容策略,确保品牌在AI流量迁移中保持可见性。

  • 品牌在deepseek、豆包里排第几?免费GEO排名查询工具帮你一键看清

    随着AI搜索普及,传统SEO正被GEO(生成式引擎优化)取代。GEO核心是提升品牌在AI生成答案中的可见度,而非获取点击流量。数据显示超60%用户已使用AI搜索,若品牌未被AI提及将失去流量入口。文章推荐免费工具AIBase,支持多平台一键检测品牌在主流AI助手的曝光排名、竞品对比及可视化报告,并提供内容权威性、语义化表达等GEO优化策略,帮助品牌在AI时代建立竞争优势。

  • 全球开源技术峰会GOTC 2025 圆满落幕

    11月2日,为期两天的全球开源技术峰会GOT C2025在北京圆满落幕。本届峰会聚焦开源与人工智能深度融合,汇聚全球顶尖专家、行业领袖与数千开发者,共同探讨开源驱动的AI未来蓝图。现场吸引超3000人次参与,线上直播观看量突破500万,全网曝光超6亿次。大会设立十二大专题论坛,覆盖大模型应用、AI编程、云原生AI等前沿领域,并发布Open AgentKit等关键项目。通过“论坛+市集�

  • 首次参赛即获佳绩,易鑫摘得2025“直通乌镇”全球互联网大赛一等奖

    11月9日,2025年“直通乌镇”全球互联网大赛总决赛颁奖典礼圆满落幕。首次参赛的易鑫(02858.HK)凭借自主研发的一站式汽车金融AI智能服务解决方案“易鑫智服”,成功斩获一等奖。易鑫获得2025“直通乌镇”全球互联网大赛一等奖“直通乌镇”是世界互联网大会乌镇峰会的重要板块之一,此次大赛吸引了全球29个国家和地区的1082个优质项目参赛。经过层层选拔,易鑫摘得一�

  • 5.22万人潮涌动,超千万次云端围观!CEIC 2025圆满落幕!

    11月8日,为期三天的科技狂欢在深圳圆满落幕。大会吸引全球5.22万人次到访及云端超千万次关注,聚焦智能生活、产业创新、数字健康三大议题,通过16场分论坛及30余场专题会议深入探讨AI赋能消费电子趋势。华为、荣耀等企业展示了折叠屏、全屋智能等创新产品,裸眼3D、智能座舱等技术让未来科技触手可及。大会推动技术、产业与资本对接,构建开放协作的产业新生态,彰显中国消费电子创新活力与全球影响力。

今日大家都在搜的词: