首页 > 业界 > 关键词  > Qwen2-VL最新资讯  > 正文

阿里重磅开源Qwen2-VL:能理解超20分钟视频,媲美GPT-4o!

2024-08-30 08:49 · 稿源: AIGC开放社区公众号

阿里巴巴开源了最新视觉多模态模型Qwen2-VL,根据测试数据显示,其72B模型在大部分指标超过了OpenAI的GPT-4o,Anthropic的Claude3.5-Sonnet等著名闭源模型,成为目前最强多模态模型之一。Qwen2-VL支持中文、英文、日文、韩文等众多语言,可以在 Apache2.0协议下进行商业化使用。同

......

本文由站长之家合作伙伴自媒体作者“AIGC开放社区公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • Qwen登顶AI赚钱大赛只是开始?“弃GPT投Qwen”已在硅谷蔓延开来

    近期AI炒币大赛Alpha Arena引发关注,六款主流大模型用1万美元本金在币圈实战。戏剧性的是,被寄予厚望的GPT-5和Gemini因高杠杆操作亏损惨重,而中国开源模型表现亮眼——通义千问Qwen以53%回报率逆袭登顶,DeepSeek紧随其后。硅谷巨头Airbnb CEO公开表态依赖Qwen,投资人Chamath也承认将业务转向中国模型。市场用真金白银投票:预测平台押注Qwen胜率高达36%,远超OpenAI的3%。这场竞赛�

  • AI日报:OpenAI发布浏览器Atlas;通义Qwen3-VL新增2B、32B两个模型尺寸;百川发布循环证据增强大模型

    本文汇总AI领域最新动态:OpenAI推出集成ChatGPT的Atlas浏览器,实现多任务自主处理;阿里通义千问新增2B/32B视觉语言模型,手机可流畅运行;谷歌AI Studio升级Vibe Coding功能,简化应用开发流程;百川发布医疗大模型M2Plus,通过循证推理降低误诊率;奇瑞墨甲机器人实现L3级技术突破,计划多行业应用;YouTube推出AI肖像识别工具,打击虚假内容;三星宣布2026年推出AI眼镜,融合AR与语音助手;Claude客户端更新,支持截图分析和语音交互功能。

  • AI日报:美团LongCat-Flash-Omni发布;Qwen3-Max上线深度思考功能;百度“文心”5.0重磅回归

    本期AI日报聚焦多领域技术突破:美团发布全模态交互模型LongCat-Flash-Omni;阿里通义千问Qwen3-Max上线深度思考功能;百度文心5.0升级多模态生成能力;谷歌确认Gemini3年内发布并整合至苹果Siri;OpenAI向多国开放Sora2视频工具;云存储与AI开发工具持续优化,展现行业加速迭代态势。

  • AI日报:月之暗面开源AI新框架Kosong;百度发布新模型ERNIE-4.5-VL;GPT-5.1“隐身”登场

    本期AI日报聚焦多项技术突破:月之暗面开源AI代理框架Kosong,支持异步编排与插件化设计;Replit推出AI集成功能,可一键调用300+模型;商汤发布空间智能模型SenseNova-SI,性能超越GPT-5;百度推出多模态模型ERNIE-4.5-VL,新增图像思考能力;谷歌地图全面AI化,集成Gemini实现智能交互;ChatTutor上线可视化教学系统,覆盖多学科实时推演;新版Google Finance引入AI深度搜索与财报追踪;OpenAI低调上线Polaris Alpha模型,支持256K上下文并更新知识库至2024年10月。

  • 只有0.9B的PaddleOCR-VL,却是现在最强的OCR模型。

    ​这几天,OCR这个词,绝对是整个AI圈最火的词。因为DeepSeek-OCR,甚至让OCR这个赛道文艺复兴,又给直接带火了。 整个Hugging Face的趋势版里,前4有3个OCR,甚至Qwen3-VL-8B也能干OCR的活,说一句全员OCR真的不过分。 然后在我上一篇讲DeepSeek-OCR文章的评论区里,有很多朋友都在把DeepSeek-OCR跟PaddleOCR-VL做对比,也有很多人都在问,能不能再解读一下百度那个OCR模型(也就是PaddleOCR-VL

  • AI日报:阿里发布紧凑型Qwen3-VL模型;科大讯飞AI翻译耳机全球首发;Gemini代码惊现Veo3.1

    阿里巴巴发布紧凑型Qwen3-VL多模态模型,推动边缘设备AI应用;科大讯飞推出全球首款AI翻译耳机,支持60种语言实时翻译;谷歌NotebookLM集成图像生成功能,可将笔记转为动态视频;ChatGPT将于12月向成人开放限制内容并推出自定义交互功能;谷歌Gemini代码泄露Veo3.1视频模型升级迹象;马斯克宣布X平台将全面转向AI推荐系统;巨人网络与清华联合开源多方言语音合成框架DiaMoE-TTS;vivo公布X200系列影像升级计划;字节跳动开源文本驱动高保真人脸生成模型FaceCLIP。

  • AI日报:谷歌发布Veo 3.1;通义千问推Qwen Chat Memory功能;Sora2免费用户可生成15秒视频

    本期AI日报聚焦多项技术更新:谷歌Veo 3.1视频模型新增音频生成与精细化编辑功能;通义千问推出记忆功能提升对话连贯性;Sora2免费用户可生成15秒视频,Pro版支持25秒;百度文心助手升级8种创作模式;谷歌Flow工具增强视频光影编辑与音频合成能力;Anthropic发布高性价比Claude Haiku 4.5;北京查处首例AI虚假广告案,涉伪造主持人带货;阿里推出响应仅200毫秒的编程工具Qoder CLI。

  • 5.22万人潮涌动,超千万次云端围观!CEIC 2025圆满落幕!

    2025年11月8日,为期三天的消费电子创新大会(CEIC2025)在深圳圆满落幕。大会以“新电子·新消费·新体验”为主题,汇聚全球20个国家近300家科技企业,展出超2000项创新产品,吸引首日1.8万人次观展,累计达5.22万人。同期举办19场论坛,近300位行业领袖分享见解,直播观看量超千万。聚焦智能生活、产业创新、数字健康三大议题,深度解读AI赋能消费电子趋势。华为、荣耀等企业展示全场景智能终端,推动技术从“可用”到“好用”跨越;智能汽车、家居、健康领域呈现沉浸式体验,裸眼3D、机器人等黑科技重塑生活想象。大会构建技术、产业与资本对接桥梁,彰显中国消费电子创新活力,引领全球产业协同发展新生态。

  • AI日报:媲美GPT-4!智谱AI发布最新模型GLM-4-Plus;阿里重磅开源超强AI模型Qwen2-VL;国产AI神器NotePin在国外火了

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、智谱AI震撼发布GLM-4-Plus:媲美GPT-4,首创C端视频通话功能智谱AI最新发布的GLM-4-Plus模型展示了与OpenAIGPT-4媲美的强大视觉能力,即将开放使用。数百个开源LLM服务器泄露企业和健

  • 2025港科百创决赛在京落幕 锐意升学刘王锐参与前十强评审

    11月7日,“香港科大-东聚智”2025人工智能百万奖金国际创业大赛决赛在京举办。锐意升学CEO刘王锐作为赛事“百万奖金投委团”十大评委之一受邀出席,见证我国顶尖硬核科创领域的商业竞技。赛事聚焦人工智能,累计孵化企业超1747家,覆盖智慧医疗、芯片、量子计算等前沿领域,发放奖金近7000万元。作为全球最具影响力的科技创业大赛之一,该赛事持续推动硬科技初创项目成长,稳固科创界“黄金赛事”地位。

今日大家都在搜的词: