阿里云通义开源Qwen2.5-VL：视觉AI 超越GPT-4o

2025-01-28 16:12 · 稿源：快科技

阿里云通义推出视觉模型 Qwen2.5-VL

阿里云通义近日开源了其最新的视觉模型 Qwen2.5-VL，该模型推出三个版本：3B、7B 和 72B。其中，旗舰版 Qwen2.5-VL-72B 在 13 项权威评测中夺得视觉理解冠军，超越了 GPT-4o 和 Claude3.5。

Qwen2.5-VL 模型能够更准确地解析图像内容，并支持超过 1 小时的视频理解。它可以在视频中搜索特定事件，并对视频的不同时间段进行要点总结，帮助用户快速有效地提取视频中的关键信息。

此外，Qwen2.5-VL 还可以无需微调就变身为一个能够操控手机和电脑的 AI 视觉智能体（Visual Agents），实现给指定朋友发送祝福、电脑修图、手机订票等多步骤复杂操作。

Qwen2.5-VL 不仅擅长识别常见物体，还能够分析图像中的文本、图表、图标、图形和布局。它还将 OCR 识别能力提升到了一个新的水平，增强了多场景、多语言和多方向的文本识别和定位能力。

在信息抽取方面，Qwen2.5-VL 也进行了大幅度增强，以满足日益增长的资质审核、金融商务等数字化、智能化需求。

（举报）

相关推荐

关键词：

让天下没有难查的故障：2025 阿里云 AI 原生编程挑战赛正式启动

阿里云主办的2025 AI原生编程挑战赛聚焦智能运维（AIOps）赛道，旨在通过AI技术解决云原生环境下的系统故障定位问题。比赛提供真实云原生环境及多模态可观测数据，鼓励开发者借助大语言模型（LLM）打造低成本、高效率的故障诊断智能体。冠军可获得3万元奖金，并有机会与行业专家交流。赛事致力于推动AI在运维领域的创新应用，提升系统稳定性与可用性。

云原生 AI原生架构 Operation
荐AI日报：腾讯开源3D世界模型HunyuanWorld-Voyager；即梦AI系列模型开放API；通义推智能体开发框架AgentScope 1.0

本文介绍了AI日报栏目，聚焦人工智能领域最新动态。主要内容包括：腾讯开源具备3D重建能力的HunyuanWorld-Voyager模型、通义实验室推出的多智能体开发框架AgentScope 1.0、即梦AI开放图像与视频生成API、腾讯翻译模型Hunyuan-MT-7B在WMT2025斩获佳绩、苹果推出图像生成技术STARFlow和视觉语言模型FastVLM、新模型CoMPaSS-FLUX.1提升空间理解能力、Cherry Studio免费提供Qwen38B模型、谷歌Gemini API新增网页内容解析功能，以及腾讯优图开源智能体框架Youtu-Agent。这些进展展现了AI技术在多个领域的创新与应用。

AI 3D重建腾讯开源
小度赋能“苏超”推出智能体“i苏超”，AI重塑体育资讯与服务体验

“苏超”作为国民级赛事引发全民关注。为优化赛事资讯体验，小度科技与“苏超”深度合作，打造智能资讯服务助手“i苏超”，已在新华日报交汇点新闻客户端上线。该智能体不仅提供赛事安排、积分榜等专业信息，还能解答江苏本地生活问题，实现AI技术与垂直场景的深度融合。未来小度赋能力量将延伸至千行百业，推动AI智慧解决方案在各领域的定制化应用。

苏超赛事资讯智能体
亿信华辰发布智问4.0，打造企业级多智能体平台

亿信华辰发布企业级多智能体平台“数智平台-智问4.0”，深度融合大模型技术与企业数据资产，提供问答型、知识型、工具型和对话型四大智能体应用。该平台支持低代码可视化编排，实现从数据查询到智能分析的全流程覆盖，已在政府、医疗、金融等多行业落地，显著提升审批效率和决策智能化水平，推动企业从“人找数据”向“数据找人”的智慧化转型。

人工智能企业智能化大型语言模型
MCP模型库全面指南：AI开发者如何利用超12万个服务构建多功能智能体应用？

MCP协议正成为AI智能体开发的关键标准，其核心价值在于标准化、安全性和模块化。当前MCP生态虽繁荣但存在资源碎片化、质量参差不齐等痛点。AIbase MCP模型库通过一站式整合全球超12万服务，提供高可靠、低延迟的技术方案，大幅降低开发复杂度。该平台为企业级应用提供从概念验证到部署的全流程支持，帮助开发者聚焦核心业务逻辑，释放MCP生态的全部潜力。

MCP协议 AI智能体开发 Model
MCP模型库深度解析：AI智能体工具调用生态的多元化与规模化发展

AIbase旗下MCP模型库收录服务数量突破12万，标志着AI智能体生态迈向成熟。MCP协议为AI工具调用提供标准化蓝图，其成功取决于生态规模与活力。平台覆盖工具、知识库、数据源、控制系统等多元领域，展现高度多样性。一站式整合平台降低开发成本，助力企业快速构建复杂应用，成为感知AI技术风向的重要窗口。

AI行业观察 MCP模型库 AI智能体生态
视觉中国2025半年报：AI创意定制业务同比增长超20%

视觉中国发布2025年半年度报告，实现营收39.9亿元，归母净利润4.38亿元。公司聚焦AI技术研发与应用，AI创意定制业务同比增长超20%，成为新增长点。推出AI辅助创作功能，上线一站式创意生成平台，服务华为、荣耀等客户。音视频业务销售额占比超32%，签约AI创作者超9000名。持续加强版权保护，当选中国版权协会理事单位。未来将深化AI技术与版权数据融合，共建数字文化新生态。

视觉中国 2025半年报 AI技术研发
荐刚刚，全网最懂图文调研的智能体模型震撼上线，看完我直接卸了浏览器

疯狂的七月已经落下了帷幕，如果用一个词来形容国产大模型，「开源」无疑是当之无愧的高频词汇。各大厂商你方唱罢我登场，昆仑万维、阿里、智谱、月之暗面、腾讯、阶跃星辰等众多玩家们先后开源了数十款大模型。根据 Hugging Face 发布的中国 AI 社区七月开放成果，短短一个月开源模型总数达到了惊人的33款。进入到八月，国产大模型「上新」的势头丝毫不减，重量�

开源大模型国产
华为千元内最好的降噪耳机！华为FreeBuds 7i来了：接入鸿蒙智能体

华为FreeBuds 7i即将登场，预计8月28日预售，9月4日首销。官方宣传图称其为华为千元内最好的降噪耳机”，支持新一代智慧动态降噪，全频段平均降噪深度28dB。支持90dB噪声下，消除环境背景音，精准拾取人声。耳机采用11mm四磁铁动圈单元，支持头部跟踪空间音频，带来声临其境的体验。关闭降噪最长使用时间为35小时，支持快充，充电10分钟就能听歌4小时。

华为FreeBuds 7i 降噪耳机
真补贴、真落地！阿里云发布AI应用先锋计划，助力企业跑通AI第一程

阿里云AI应用先锋计划通过“云+AI+行业适配”模式，助力企业突破AI落地瓶颈。该计划提供云资源补贴、POC服务、专家咨询及联合品牌推广等支持，降低企业AI应用门槛。结合端云协同架构，解决算力成本高、模型部署难等问题，已在智能硬件、教育、政务等领域实现案例落地，推动AI从技术尝鲜走向常态化应用。

AI大模型行业适配企业落地

今日大家都在搜的词：

热文

3 天
7天

阿里云通义开源Qwen2.5-VL：视觉AI 超越GPT-4o

阿里云通义推出视觉模型 Qwen2.5-VL

让天下没有难查的故障：2025 阿里云 AI 原生编程挑战赛正式启动

荐AI日报：腾讯开源3D世界模型HunyuanWorld-Voyager；即梦AI系列模型开放API；通义推智能体开发框架AgentScope 1.0

小度赋能“苏超”推出智能体“i苏超”，AI重塑体育资讯与服务体验

亿信华辰发布智问4.0，打造企业级多智能体平台

MCP模型库全面指南：AI开发者如何利用超12万个服务构建多功能智能体应用？

MCP模型库深度解析：AI智能体工具调用生态的多元化与规模化发展

视觉中国2025半年报：AI创意定制业务同比增长超20%

荐刚刚，全网最懂图文调研的智能体模型震撼上线，看完我直接卸了浏览器

华为千元内最好的降噪耳机！华为FreeBuds 7i来了：接入鸿蒙智能体

真补贴、真落地！阿里云发布AI应用先锋计划，助力企业跑通AI第一程

今日大家都在搜的词：

热文

华为MatePad Mini外观公布支持蜂窝网络通话功能

AI日报：AI内容新规正式生效；美团推出开源大模型LongCat；阶跃

人去世了朋友圈会消失？微信客服回应：建议保持账号活跃

苹果新增三款过时产品 iPhone 8 Plus被列为复古产品

腾讯回应被米哈游起诉：没正式程序不能违规提供QQ用户资料

抖音升级AI内容标识功能上线两项核心功能

AI日报：腾讯开源3D世界模型HunyuanWorld-Voyager；即梦AI系列

小米汽车8月交付量超3万台全年交付量有望冲击42万

特斯拉Model 3长续航后轮驱动版降价1万元售价25.95万起

小鹏汽车：8月共交付新车37709台单月交付量创历史新高

华为MatePad Mini官宣9月4日发布

今日七夕节微信 520 元大额红包限时上线

首发iPhone 17系列！苹果Apple Store官方旗舰店入驻抖音商城

史上最大Mate！华为智慧屏MateTV将于9月4日发布

AI日报：海螺AI首尾帧功能上线；元石科技发布问小白5；OpenAI发

华为MatePad Mini外观公布支持蜂窝网络通话功能

华为上半年营收4270亿元同比增长3.95%：净利润371.95亿元

AI日报：AI内容新规正式生效；美团推出开源大模型LongCat；阶跃

人去世了朋友圈会消失？微信客服回应：建议保持账号活跃

小米回应升级Beta后手机很烫：系统编译致短期功耗增加

站长商机