阿里重磅开源Qwen2-VL：能理解超20分钟视频，媲美GPT-4o！

2024-08-30 08:49 · 稿源： AIGC开放社区公众号

阿里巴巴开源了最新视觉多模态模型Qwen2-VL，根据测试数据显示，其72B模型在大部分指标超过了OpenAI的GPT-4o，Anthropic的Claude3.5-Sonnet等著名闭源模型，成为目前最强多模态模型之一。Qwen2-VL支持中文、英文、日文、韩文等众多语言，可以在 Apache2.0协议下进行商业化使用。同

......

本文由站长之家合作伙伴自媒体作者“AIGC开放社区公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

（举报）

相关推荐

关键词：

Qwen2-VL

荐Qwen登顶AI赚钱大赛只是开始？“弃GPT投Qwen”已在硅谷蔓延开来

近期AI炒币大赛Alpha Arena引发关注，六款主流大模型用1万美元本金在币圈实战。戏剧性的是，被寄予厚望的GPT-5和Gemini因高杠杆操作亏损惨重，而中国开源模型表现亮眼——通义千问Qwen以53%回报率逆袭登顶，DeepSeek紧随其后。硅谷巨头Airbnb CEO公开表态依赖Qwen，投资人Chamath也承认将业务转向中国模型。市场用真金白银投票：预测平台押注Qwen胜率高达36%，远超OpenAI的3%。这场竞赛�

AI炒币大赛 Alpha Arena
荐AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功能；百度“文心”5.0重磅回归

本期AI日报聚焦多领域技术突破：美团发布全模态交互模型LongCat-Flash-Omni；阿里通义千问Qwen3-Max上线深度思考功能；百度文心5.0升级多模态生成能力；谷歌确认Gemini3年内发布并整合至苹果Siri；OpenAI向多国开放Sora2视频工具；云存储与AI开发工具持续优化，展现行业加速迭代态势。

AI 多模态实时交互
荐AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.5-VL；GPT-5.1“隐身”登场

本期AI日报聚焦多项技术突破：月之暗面开源AI代理框架Kosong，支持异步编排与插件化设计；Replit推出AI集成功能，可一键调用300+模型；商汤发布空间智能模型SenseNova-SI，性能超越GPT-5；百度推出多模态模型ERNIE-4.5-VL，新增图像思考能力；谷歌地图全面AI化，集成Gemini实现智能交互；ChatTutor上线可视化教学系统，覆盖多学科实时推演；新版Google Finance引入AI深度搜索与财报追踪；OpenAI低调上线Polaris Alpha模型，支持256K上下文并更新知识库至2024年10月。

AI代理开源框架异步编排
AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个模型尺寸；百川发布循环证据增强大模型

本文汇总AI领域最新动态：OpenAI推出集成ChatGPT的Atlas浏览器，实现多任务自主处理；阿里通义千问新增2B/32B视觉语言模型，手机可流畅运行；谷歌AI Studio升级Vibe Coding功能，简化应用开发流程；百川发布医疗大模型M2Plus，通过循证推理降低误诊率；奇瑞墨甲机器人实现L3级技术突破，计划多行业应用；YouTube推出AI肖像识别工具，打击虚假内容；三星宣布2026年推出AI眼镜，融合AR与语音助手；Claude客户端更新，支持截图分析和语音交互功能。

AI OpenAI ChatGPT
荐只有0.9B的PaddleOCR-VL，却是现在最强的OCR模型。

这几天，OCR这个词，绝对是整个AI圈最火的词。因为DeepSeek-OCR，甚至让OCR这个赛道文艺复兴，又给直接带火了。整个Hugging Face的趋势版里，前4有3个OCR，甚至Qwen3-VL-8B也能干OCR的活，说一句全员OCR真的不过分。然后在我上一篇讲DeepSeek-OCR文章的评论区里，有很多朋友都在把DeepSeek-OCR跟PaddleOCR-VL做对比，也有很多人都在问，能不能再解读一下百度那个OCR模型（也就是PaddleOCR-VL

OCR DeepSeek-OCR PaddleOCR-VL
苹果发布iOS 26.2 beta 2：动效更流畅、继续适配液态玻璃

苹果今天凌晨发布了iOS 26.2 beta 2，依然在适配更多的液态玻璃效果，并且还优化了动画效果，更流畅丝滑了。以下是本次主要更新内容：游戏库新增排序与筛选功能，支持手柄导航，且在播放过程中可实时更新分数。新版还强化了社交互动功能，用户可以直接从游戏”应用中邀请朋友进行挑战或实时多人游戏，当朋友打破你的高分纪录时，系统还会发送通知，方便你立即�

iOS 26.2 游戏库更新
荐AI日报：媲美GPT-4！智谱AI发布最新模型GLM-4-Plus；阿里重磅开源超强AI模型Qwen2-VL；国产AI神器NotePin在国外火了

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、智谱AI震撼发布GLM-4-Plus：媲美GPT-4，首创C端视频通话功能智谱AI最新发布的GLM-4-Plus模型展示了与OpenAIGPT-4媲美的强大视觉能力，即将开放使用。数百个开源LLM服务器泄露企业和健

智谱AI
腾讯控股：2025年第三季度，国际市场游戏收入首次突破200亿元大关至208亿元

11月13日，腾讯公布2025年第三季度业绩，网络游戏总收入636亿元。其中国际市场游戏收入同比增长43%，首次突破200亿元大关，达208亿元，主要得益于Supercell旗下游戏收入增长、近期收购工作室贡献及新作《消逝的光芒：困兽》销量表现。本土市场游戏收入428亿元，同比增长15%，主要受益于《三角洲行动》等新游戏及《王者荣耀》《和平精英》等长青游戏收入增长，新手游《无畏契约》亦有贡献。

腾讯游戏收入国际市场游戏本土市场游戏
腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

腾讯控股今日公布2025年第三季度财报，显示截至9月30日的三个月内，公司实现营收1929亿元，同比增长15%;权益持有人应占利润达631亿元，同比增长19%。若按非国际财务报告准则计算，该利润为706亿元，同比增长18%，整体业绩表现超出市场预期。分业务板块看，增值服务业务收入达959亿元，同比增长16%，成为核心增长引擎。其中，本土市场游戏收入428亿元，同比增长15%;国际市�

腾讯财报游戏收入增值服务
5.22万人潮涌动，超千万次云端围观！CEIC 2025圆满落幕！

2025年11月8日，为期三天的消费电子创新大会（CEIC2025）在深圳圆满落幕。大会以“新电子·新消费·新体验”为主题，汇聚全球20个国家近300家科技企业，展出超2000项创新产品，吸引首日1.8万人次观展，累计达5.22万人。同期举办19场论坛，近300位行业领袖分享见解，直播观看量超千万。聚焦智能生活、产业创新、数字健康三大议题，深度解读AI赋能消费电子趋势。华为、荣耀等企业展示全场景智能终端，推动技术从“可用”到“好用”跨越；智能汽车、家居、健康领域呈现沉浸式体验，裸眼3D、机器人等黑科技重塑生活想象。大会构建技术、产业与资本对接桥梁，彰显中国消费电子创新活力，引领全球产业协同发展新生态。

智能生活产业创新数字健康

今日大家都在搜的词：

热文

3 天
7天

阿里重磅开源Qwen2-VL：能理解超20分钟视频，媲美GPT-4o！

荐Qwen登顶AI赚钱大赛只是开始？“弃GPT投Qwen”已在硅谷蔓延开来

荐AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功能；百度“文心”5.0重磅回归

荐AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.5-VL；GPT-5.1“隐身”登场

AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个模型尺寸；百川发布循环证据增强大模型

荐只有0.9B的PaddleOCR-VL，却是现在最强的OCR模型。

苹果发布iOS 26.2 beta 2：动效更流畅、继续适配液态玻璃

荐AI日报：媲美GPT-4！智谱AI发布最新模型GLM-4-Plus；阿里重磅开源超强AI模型Qwen2-VL；国产AI神器NotePin在国外火了

腾讯控股：2025年第三季度，国际市场游戏收入首次突破200亿元大关至208亿元

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

5.22万人潮涌动，超千万次云端围观！CEIC 2025圆满落幕！

今日大家都在搜的词：

热文

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

雷军回应小米双11战绩：谢谢大家支持

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

卢伟冰：小米手机双11连续三年国产销量第一

AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.

腾讯回应QQ群最早是为了员工约饭：是一个朴实无华的需求

华为Mate 70 Air今日开售：处理器双版本可选售价4199元起

95岁巴菲特每周还上5天班此前计划年底退休

微信宣布治理恶意外部链接：6类违规内容将遭限访

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

雷军回应小米双11战绩：谢谢大家支持

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推

卢伟冰：小米手机双11连续三年国产销量第一

OPPO Reno15系列定档11月17日发布

焕新享界S9开卖72小时预订突破8000台

AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.

腾讯回应QQ群最早是为了员工约饭：是一个朴实无华的需求

站长商机