首页 > 业界 > 关键词  > 阿里云最新资讯  > 正文

阿里云百炼上线Qwen2.5-Turbo模型:支持100万超长上下文

2024-11-20 16:38 · 稿源: 快科技

阿里云百炼发布Qwen2.5-Turbo模型,支持超长上下文处理

阿里云百炼上线Qwen2.5-Turbo模型:支持100万超长上下文

据悉,Qwen2.5-Turbo模型支持高达100万超长上下文,相当于100万个英文单词或150万个汉字。在多个长文本评测集中,其性能表现超越了GPT-4。

该模型可应用于多种场景,例如:长篇小说深入理解、代码助手和多篇论文阅读。它能够一次性处理10本长篇小说、150小时的演讲稿或3万行代码。

阿里云百炼上线Qwen2.5-Turbo模型:支持100万超长上下文

具体来说,在1M长度的超长文本检索任务中,Qwen2.5-Turbo的准确率达到100%。在长文本评测集RULER上,其得分达到93.1分,超越GPT-4。

在LV-Eval、LongBench-Chat等更接近真实场景的长文本任务中,Qwen2.5-Turbo在大多数维度上超越了GPT-4o-mini。

阿里云百炼上线Qwen2.5-Turbo模型:支持100万超长上下文

除了长文本,Qwen2.5-Turbo在短文本基准上的表现也十分出色,在大多数任务上显著超越了之前上下文长度为1M tokens的开源模型。

阿里云百炼上线Qwen2.5-Turbo模型:支持100万超长上下文

在推理速度方面,该模型利用稀疏注意力机制将注意力部分的计算量压缩了约12.5倍,将处理1M tokens上下文时的首字返回时间从4.9分钟降低到了68秒,速度提升了4.3倍。

尽管如此,长文本任务处理仍面临诸多挑战。未来,阿里云百炼将继续探索长序列人类偏好对齐,优化推理效率和研发更大、更强的长文本模型。

举报

  • 相关推荐
  • 硅基流动入驻阿里云云市场,核心API服务将全面接入阿里云百炼平台

    6月18日,AI基础设施企业硅基流动与阿里云达成战略合作,加入阿里云"繁花计划"并入驻云市场。其大模型推理平台SiliconCloud的核心API服务将全面接入阿里云百炼平台,借助阿里云灵骏智能计算集群的算力支持,为客户提供开箱即用的大模型服务。作为国内增长最快的第三方MaaS平台,SiliconCloud已集成通义千问Qwen3、DeepSeek等百余款主流开源大模型,累计服务600万用户与数千家企业客户。此次合作将增强平台在推理场景下的弹性扩展能力,未来双方还将在算力协同、行业解决方案共建等方面深化合作。

  • AI日报:阿里通义推Qwen-TTS模型;Cursor已支持网页和手机端;字节发布图像合成技术XVerse

    【AI日报】今日AI领域7大突破:1)阿里通义Qwen-TTS实现方言语音合成重大突破;2)Cursor发布Web版AI编程工具;3)字节XVerse技术实现多对象精准图像生成;4)NoteGen跨平台AI笔记工具革新知识管理;5)ManimML动画库可视化Transformer架构;6)TEN+Agent开源语音交互技术降低延迟;7)Chai-2抗体设计模型将药物研发周期缩短至两周。淘宝同时上线RecGPT推荐模型提升购物体验。

  • AI日报:MiniMax-M1开源;阿里Qwen3升级版适配苹果MLX架构;月之暗面发布新模型Kimi-Dev-72B

    《AI日报》汇总了近期AI领域多项重要进展:1)月之暗面推出开源编程模型Kimi-Dev-72B,在软件工程任务测试中创下新纪录;2)MiniMax开源M1模型,支持超长上下文推理且训练成本低;3)腾讯发布AI音乐模型LeVo,支持音色克隆和分轨生成;4)阿里云Qwen3升级版适配苹果MLX架构;5)豆包推出"AI播客"功能,可将PDF转为对话播客;6)夸克App上线个性化AI家教"夸克老师";7)松下发布多模态大模型OmniFlow,实现文本/图像/音频自由切换;8)TikTok推出三款AI视频创作工具;9)极氪与火山引擎合作,将豆包大模型接入智能座舱系统;10)Meta的Llama3.1模型在文本记忆方面表现突出;11)Grok上线定时追踪X热门话题功能;12)Gemini2.5Pro即将更新Deep Think功能;13)谷歌地图引入AI技术升级导航和个性化推荐功能。

  • AI日报:MiniMax发布视频智能体Hailuo Agent;昆仑万维开源 Skywork-SWE-32B;B站接入Qwen 3等模型

    本期AI日报聚焦多项AI领域创新:1)MiniMax推出视频Agent工具,支持文本生成高清视频及人脸驱动;2)昆仑万维开源Skywork-SWE-32B模型,提升软件工程任务表现;3)B站接入通义千问模型,推出数据分析智能体InsightAgent;4)ChatGPT深度整合Gmail与日历功能;5)腾讯云发布全链路AI开发平台"AI Builder";6)HeyGen推出UGC广告数字人功能;7)研究显示过度依赖AI或削弱批判性思维。此外还涵盖AI音乐生成、内容检测工具停运等动态,展现AI技术快速发展的多元应用与潜在影响。

  • AI日报:通义千问开源Qwen3向量模型;字节跳动图像编辑模型SeedEdit 3.0;ElevenLabs推v3语音模型

    本文汇总了近期AI领域的重要动态:1)通义千问发布Qwen3-Embedding系列模型,在多语言文本处理表现优异;2)字节跳动推出图像编辑模型SeedEdit3.0,提升细节保持能力;3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha;4)Anthropic推出面向国家安全的Claude Gov模型;5)可灵AI月收入连续两月超1亿元;6)Meta公布智能眼镜Aria Gen2技术细节;7)爱诗科技上线AI视频工具"拍我AI";8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

  • 阿里云”618创新加速季“开启:先进、领先的大模型限免 超7000万 token,加速多场景 AI 应用落地

    阿里云启动"618创新加速季"活动,聚焦AI创新与云端智能,推出多项优惠:1)提供7000万+免费大模型token体验及最高1728元优惠券;2)通义大模型限免超7000万token,推出10-100元多档资源包,GPU服务0.9折起;3)PAI平台推出通用节省计划,最低3折;4)针对中小企业推出AI火花会主题活动,提供场景化定制服务;5)基础云产品全线优惠,包括轻量服务器38元/年、RDS MySQL 88元/年等。活动还包含5亿算力补贴计划、10万元出海满减券等专项支持,助力企业智能化升级。

  • 「6月30日AI日报」百度开源文心大模型4.5系列;通义千问发布多模态生成模型Qwen VLo

    AI日报精选:1)百度开源文心大模型4.5系列,含10款新模型,性能优异;2)通义千问发布多模态模型Qwen-VL,支持图文交互;3)阿里开源3亿参数多模态模型Ovis-U1;4)华为开源盘古7B稠密和72B混合专家模型;5)美图MOKI推出AI创意广告功能,一键生成专业视频;6)谷歌Gemini 2.5 Pro API重新免费开放;7)豆瓣上线"深入研究"AI功能;8)小米"AI百宝箱"结束内测;9)北京智研院开源多模态系统OmniGen2;10)知乎升级"直答"知识库功能。

  • 美团第100万顶智能头盔交付:自带碰撞检测、蓝牙耳机

    美团官方今天宣布,第100万顶智能头盔正式交付。 美团表示,骑手伙伴路上的安全,是高效完成使命的基础。 据介绍,目前的美团智能头盔拥有语音交互(指令响应、通话)设计,核心在于减少骑行中因操作手机分神带来的风险。 内置跌倒检测功能,能在意外发生的第一时间触发SOS求助机制,为骑手争取宝贵的救援时间。 此外还会及时提醒天气变化(如下雨),帮助骑手

  • AI日报:夸克发布首个高考志愿大模型;Trae月活跃用户破100万;Manus推出免费无限聊天模式

    【AI日报】今日AI领域热点速览: 1. 夸克APP推出高考志愿大模型,免费提供个性化填报指导 2. Manus AI开放免费无限聊天模式,挑战行业巨头 3. Trae开发者平台月活破百万,累计交付60亿行代码 4. 迪士尼环球起诉Midjourney侵犯影视版权 5. 维基百科暂停AI生成摘要实验 6. 360发布"纳米AI超级搜索智能体",内置80多款大模型 7. PartCrafter项目实现单张图片生成高精度3D模型 8. Meta推出AI视频编辑工具,支持50多种预设效果 9. 阿里工程师放弃春节假期全力追赶DeepSeek技术 10. 火山引擎发布PromptPilot智能提示优化平台 11. OpenAI洽谈400亿美元融资,拓展AI生态系统 12. 新一代o3-pro推理模型发布并调整API定价策略

  • 阿里云瓴羊连续6年入选 Gartner®ABI 魔力象限报告,中国唯一!

    Gartner发布2025年商业智能平台魔力象限报告,阿里云Quick BI凭借其数据分析能力连续第六年入选"挑战者"象限。报告指出,生成式AI正推动商业智能平台变革,供应商聚焦AI代理和自然语言处理能力创新。Quick BI的核心竞争力在于可视化、报表和自然语言查询功能,通过AI助手"智能小Q"提升用户体验,支持企业级数据分析全链路。该产品已服务多个行业头部客户,如圣迪乐优化鸡蛋生产全流程、跨越速运降低人力成本等。阿里云表示将持续深化AI在数据分析领域的应用,巩固其在全球商业智能市场的地位。