首页 > 业界 > 关键词  > 阿里云最新资讯  > 正文

阿里云百炼上线Qwen2.5-Turbo模型:支持100万超长上下文

2024-11-20 16:38 · 稿源: 快科技

阿里云百炼发布Qwen2.5-Turbo模型,支持超长上下文处理

阿里云百炼上线Qwen2.5-Turbo模型:支持100万超长上下文

据悉,Qwen2.5-Turbo模型支持高达100万超长上下文,相当于100万个英文单词或150万个汉字。在多个长文本评测集中,其性能表现超越了GPT-4。

该模型可应用于多种场景,例如:长篇小说深入理解、代码助手和多篇论文阅读。它能够一次性处理10本长篇小说、150小时的演讲稿或3万行代码。

阿里云百炼上线Qwen2.5-Turbo模型:支持100万超长上下文

具体来说,在1M长度的超长文本检索任务中,Qwen2.5-Turbo的准确率达到100%。在长文本评测集RULER上,其得分达到93.1分,超越GPT-4。

在LV-Eval、LongBench-Chat等更接近真实场景的长文本任务中,Qwen2.5-Turbo在大多数维度上超越了GPT-4o-mini。

阿里云百炼上线Qwen2.5-Turbo模型:支持100万超长上下文

除了长文本,Qwen2.5-Turbo在短文本基准上的表现也十分出色,在大多数任务上显著超越了之前上下文长度为1M tokens的开源模型。

阿里云百炼上线Qwen2.5-Turbo模型:支持100万超长上下文

在推理速度方面,该模型利用稀疏注意力机制将注意力部分的计算量压缩了约12.5倍,将处理1M tokens上下文时的首字返回时间从4.9分钟降低到了68秒,速度提升了4.3倍。

尽管如此,长文本任务处理仍面临诸多挑战。未来,阿里云百炼将继续探索长序列人类偏好对齐,优化推理效率和研发更大、更强的长文本模型。

举报

  • 相关推荐
  • 云原生API安全获认可,绿盟科技入选 Gartner®《Hype Cycle™ for APIs, 2025》

    近日,Gartner发布《Hype Cycle™ for APIs,2025》报告,绿盟科技凭借云原生API安全方案入选API威胁防护领域代表厂商。该方案针对云原生环境下的API全流量防护,适配容器化、微服务架构等特性,解决东西向流量防护难题,已在金融行业试点应用,帮助用户构建稳定可靠的云原生API安全防护体系,保障核心业务数据机密性、完整性与可用性。

  • 再获认可!腾讯云入选Gartner® API管理市场指南

    Gartner发布《中国API管理市场指南》,腾讯云API安全网关入选代表供应商。报告指出,随着企业数字化、云和物联网的广泛应用,API成为数字化体验的核心,但也面临安全与隐私风险。Gartner建议企业选择支持API设计、测试、版本控制的工具,并关注混合部署和云原生功能。腾讯云WAF-API提供零部署、资产自动发现、场景识别等六大能力,助力企业构建全生命周期API安全治理。

  • 2025年大模型选型核心指南:Beyond GPT-4,如何理性评估Qwen、DeepSeek等强者?

    大模型选择能力已成为AI时代企业核心竞争力。文章提出“能力-成本-场景”三维评估框架,强调需超越单一指标崇拜,基于客观数据和实际需求进行理性选择。通过Qwen2-Plus与DeepSeek-V3的对比分析,展示不同模型在特定场景下的差异化优势。建议企业建立科学选型流程,采用专业工具进行多维度评估,通过三阶段验证策略确保决策既数据驱动又经实践检验。最终目标是选择最适合业务场景的模型,而非盲目追求流行模型。

  • 阿里云百炼平台首个停车MCP服务上线,捷停车提供全维数据和场景支持

    8月初,捷停车-停车信息MCP服务正式上线阿里云百炼平台,成为该平台首个停车行业MCP服务,为开发者和用户提供高效停车信息查询能力。该服务覆盖全国400城、超5.9万停车场,注册用户突破1.4亿,支持车位查询、快速进出场及便捷缴费等全流程智慧停车体验。通过MCP服务,捷停车打破停车数据“信息孤岛”,实现专业停车能力“开箱即用”,助力出行服务体验升级,并推动停车行业与AI技术深度融合,加速智慧经济落地。

  • 阿里云AI火花大会:规模化前夜,AI务实派靠场景破局

    阿里云在深圳成功举办AI创新应用大会,提出要将"云+AI"技术转化为千行百业的商业动能。大会吸引了近千家企业参与,探讨AI技术从理论走向商业实践的路径。阿里云智能集团副总裁刘湘雯指出,AI不仅是技术演进,更是生产力革命。会议聚焦大模型与AI Agent的融合机遇,提出企业智能化转型需把握四大趋势:技术迭代加速、开源填补鸿沟、智能体从"工具人"变为"决策者"、交互革命重构人机触点。阿里云通过三层落地逻辑(模型API Server、Agent对接层、行业解决方案)助力企业穿透技术迷雾,并发布AI应用先锋计划,联合生态伙伴加速AI应用从概念验证到规模化落地。

  • AI模型库哪个好?2025年主流AI模型选型指南与API成本对比推荐

    AI时代企业核心挑战已从“能否做AI”转向“如何高效集成AI能力”。AI模型库通过聚合全球主流模型,提供透明化成本与能力信息,帮助企业实现快速原型验证、精准选型和成本优化。这种基础设施降低技术门槛,使非技术背景决策者也能深度参与技术选型,加速创新迭代并降低试错成本。

  • AI日报:阿里开源Qwen-Image-Edit;淘宝“AI万能搜”功能灰度测试;小红书发布DynamicFace人脸生成技术

    本期AI日报聚焦多项AI领域创新:1)阿里开源Qwen-Image-Edit图像编辑模型,支持中文渲染与精准文本编辑;2)淘宝测试"AI万能搜"功能,重构电商搜索体验;3)小红书发布DynamicFace人脸生成技术,实现高质量图像视频换脸;4)Gemini API新增URL Context功能,简化网页内容获取流程;5)Nvidia推出小型开放模型Nemotron-Nano-9B-v2,支持智能推理开关;6)马斯克发布Grok Imagine 0.1测试版,进军AI图像生成领域;7)Vercel推出iOS版AI开发工具v0;8)理想汽车发布MindGPT 3.1模型,处理速度提升5倍;9)ToonComposer工具简化动画制作流程;10)ElevenLabs推出视频到音乐生成流程。

  • 真补贴、真落地!阿里云发布AI应用先锋计划,助力企业跑通AI第一程

    阿里云AI应用先锋计划通过“云+AI+行业适配”模式,助力企业突破AI落地瓶颈。该计划提供云资源补贴、POC服务、专家咨询及联合品牌推广等支持,降低企业AI应用门槛。结合端云协同架构,解决算力成本高、模型部署难等问题,已在智能硬件、教育、政务等领域实现案例落地,推动AI从技术尝鲜走向常态化应用。

  • 当GPT-5遇上Gemini 2.5,谁更适合你的业务?这份对比报告说了算

    某跨境电商CTO复盘会上展示:GPT-5 Standard处理百万级商品描述时,费用比Gemini 2.5 Flash-Lite高35%,响应速度慢0.8秒。大模型选型面临参数迷雾、场景错配、隐藏成本三重困境。AIbase选型对比平台通过真实数据测试,提供透明价格拆解和性能雷达图,帮助规避预算陷阱。实测显示GPT-5在合同逻辑分析准确率高3.2%,而Gemini表格解析速度快40%、月总成本低26%。工具可动态追踪官方调价,生成定制化决策报告,用数据替代经验主义,提升技术选型效率。

  • 天翼云TeleDB通过信通院“可信数据库”安全专项测试

    中国信通院公布2025上半年“可信数据库”评估结果,天翼云TeleDB高可用关系型数据库通过安全专项测试,产品性能与安全能力达行业领先水平。TeleDB具备高性能、高可用、高可靠、高安全、易扩展、易管理等优势,已在政务、物联网、新能源、医疗等行业广泛应用,助力企业数字化转型。此次评测进一步验证了国产数据库的技术实力,推动我国数据库产业快速发展。

今日大家都在搜的词: