首页 > 业界 > 关键词  > 阿里云最新资讯  > 正文

阿里云百炼上线Qwen2.5-Turbo模型:支持100万超长上下文

2024-11-20 16:38 · 稿源: 快科技

阿里云百炼发布Qwen2.5-Turbo模型,支持超长上下文处理

阿里云百炼上线Qwen2.5-Turbo模型:支持100万超长上下文

据悉,Qwen2.5-Turbo模型支持高达100万超长上下文,相当于100万个英文单词或150万个汉字。在多个长文本评测集中,其性能表现超越了GPT-4。

该模型可应用于多种场景,例如:长篇小说深入理解、代码助手和多篇论文阅读。它能够一次性处理10本长篇小说、150小时的演讲稿或3万行代码。

阿里云百炼上线Qwen2.5-Turbo模型:支持100万超长上下文

具体来说,在1M长度的超长文本检索任务中,Qwen2.5-Turbo的准确率达到100%。在长文本评测集RULER上,其得分达到93.1分,超越GPT-4。

在LV-Eval、LongBench-Chat等更接近真实场景的长文本任务中,Qwen2.5-Turbo在大多数维度上超越了GPT-4o-mini。

阿里云百炼上线Qwen2.5-Turbo模型:支持100万超长上下文

除了长文本,Qwen2.5-Turbo在短文本基准上的表现也十分出色,在大多数任务上显著超越了之前上下文长度为1M tokens的开源模型。

阿里云百炼上线Qwen2.5-Turbo模型:支持100万超长上下文

在推理速度方面,该模型利用稀疏注意力机制将注意力部分的计算量压缩了约12.5倍,将处理1M tokens上下文时的首字返回时间从4.9分钟降低到了68秒,速度提升了4.3倍。

尽管如此,长文本任务处理仍面临诸多挑战。未来,阿里云百炼将继续探索长序列人类偏好对齐,优化推理效率和研发更大、更强的长文本模型。

举报

  • 相关推荐
  • Qwen登顶AI赚钱大赛只是开始?“弃GPT投Qwen”已在硅谷蔓延开来

    近期AI炒币大赛Alpha Arena引发关注,六款主流大模型用1万美元本金在币圈实战。戏剧性的是,被寄予厚望的GPT-5和Gemini因高杠杆操作亏损惨重,而中国开源模型表现亮眼——通义千问Qwen以53%回报率逆袭登顶,DeepSeek紧随其后。硅谷巨头Airbnb CEO公开表态依赖Qwen,投资人Chamath也承认将业务转向中国模型。市场用真金白银投票:预测平台押注Qwen胜率高达36%,远超OpenAI的3%。这场竞赛�

  • REDMI Turbo 5 1月登场:首发天玑8500

    博主爆料称,天玑8500芯片预计1月亮相,Redmi Turbo 5将首发搭载。该芯片采用台积电4nm工艺,配备8核A725全大核设计,主频达3.4GHz,GPU为Mali-G720,性能超越骁龙8 Gen3与8s Gen4,安兔兔跑分达220万。新机还将配备1.5K直屏与大容量电池,成为Redmi Turbo系列最强机型,值得期待。

  • DeepSeek开源3B OCR模型:长文本识别达97%精度

    DeepSeek在GitHub开源新一代OCR模型,采用创新光学二维映射压缩技术,在长文本识别场景实现97%准确率。模型通过动态压缩生成最优视觉特征令牌,较传统方法减少60%计算冗余。实验显示在1:20压缩率下仍保持60%以上准确率,显著优于同类模型。该技术路径为OCR系统小型化提供解决方案,其动态压缩策略对大型语言模型的记忆管理机制具有重要启示。

  • 首发科天玑8500!REDMI Turbo 5获认证:支持100W闪充

    继工信部入网之后,REDMI Turbo 5近日又获得了国内的3C认证,距离上市不远了。 认证信息显示,REDMI Turbo 5支持100W有线闪充,这个规格目前已经成为小米旗下主流标配。

  • REDMI Turbo 5参数出炉:首发天玑8500

    REDMI Turbo 5采用6.5英寸LTPS中尺寸直屏,电池是7500mAh,支持100W有线闪充,配备金属中框、光学屏下指纹,支持IP68级防尘防水。 另外,REDMI Turbo 5将会首发搭载天玑8500处理器,这将是联发科最强悍的天玑8系芯片。 在去年12月,天玑8400正式亮相,由REDMI Turbo 4首发,这颗芯片采用了旗舰同款全大核架构设计,拥有8个主频至高达3.25GHz的Arm Cortex-A725大核,并且二级缓存翻倍,三级缓�

  • AI日报:美团LongCat-Flash-Omni发布;Qwen3-Max上线深度思考功能;百度“文心”5.0重磅回归

    本期AI日报聚焦多领域技术突破:美团发布全模态交互模型LongCat-Flash-Omni;阿里通义千问Qwen3-Max上线深度思考功能;百度文心5.0升级多模态生成能力;谷歌确认Gemini3年内发布并整合至苹果Siri;OpenAI向多国开放Sora2视频工具;云存储与AI开发工具持续优化,展现行业加速迭代态势。

  • 全球首发天玑8500!REDMI Turbo 5系列陆续备案

    REDMI Turbo 5系列正在陆续备案中,将会承接K系列之下的2K价位段。 据此前爆料,REDMI Turbo 5将在今年12月登场,全球首发联发科天玑8500,这颗芯片基于台积电4nm制程打造,采用Arm全大核架构,集成Mali-G720 GPU,安兔兔跑分设定在200万分以上,综合成绩接近骁龙8 Gen3。

  • 卢伟冰:REDMI K系列持续向上 Turbo系列会逐步接棒K系列

    小米集团总裁卢伟冰转发博主对Redmi K90 Pro的评测,称K系列将通过科技创新持续提升体验,Turbo系列将逐步接棒。Redmi产品经理表示Turbo系列将在性能和性价比上带来惊喜。今年1月发布的Turbo 4起售价1999元,4月发布的Turbo 4 Pro同样1999元起。卢伟冰强调,随着小米高端化发展,K系列定位将持续上探,去年独立的Turbo系列正是为承接K系列上移后的定位空间。据悉,Redmi Turbo 5将于今年第四季度登场,首发联发科天玑8500,定位高性能、长续航,并升级金属中框和大R角设计,质感大幅提升。

  • 小鹏将推出3款全球化Robotaxi 2026年同步开启试运营

    小鹏汽车在2025科技日宣布,将于2026年推出三款全栈自研L4级Robotaxi,同步开启试运营。该车型搭载4颗图灵AI芯片,算力达3000TOPS,配备第二代VLA模型,具备强大泛化学习能力,能自适应全球不同交通习惯。作为中国首款全栈自研Robotaxi,无需额外改装,不依赖高精地图即可实现量产。车辆提供两套智驾方案,分别侧重通勤效率与极致安全,并在六大关键系统采用双冗余设计,确保行驶安全。小鹏还将开放Robotaxi SDK,与高德地图等伙伴共建全球服务生态。

  • AI日报:OpenAI发布浏览器Atlas;通义Qwen3-VL新增2B、32B两个模型尺寸;百川发布循环证据增强大模型

    本文汇总AI领域最新动态:OpenAI推出集成ChatGPT的Atlas浏览器,实现多任务自主处理;阿里通义千问新增2B/32B视觉语言模型,手机可流畅运行;谷歌AI Studio升级Vibe Coding功能,简化应用开发流程;百川发布医疗大模型M2Plus,通过循证推理降低误诊率;奇瑞墨甲机器人实现L3级技术突破,计划多行业应用;YouTube推出AI肖像识别工具,打击虚假内容;三星宣布2026年推出AI眼镜,融合AR与语音助手;Claude客户端更新,支持截图分析和语音交互功能。

今日大家都在搜的词: