百度智能云Qianfan-VL系列模型开源！全尺寸领域增果优异，全自研芯片计算

2025-09-23 09:21 · 稿源：站长之家用户

今天，百度智能云千帆正式推出全新视觉理解模型——Qianfan-VL，并全面开源!该系列模型包含3B、8B和70B三个尺寸版本，是面向企业级多模态应用场景，进行了深度优化的视觉理解大模型。即日起至10月10日，用户可在百度智能云千帆平台免费体验8B、70B模型。Qianfan-VL不仅具备出色的基础通用能力，还针对产业落地中的高频需求，如OCR和教育垂直场景做了专项强化，使其在实际应用中表现更加卓越。

Qianfan-VL系列模型是由百度智能云千帆模型研发团队，基于开源模型进行开发，并在百度自研昆仑芯 P800上完成全流程计算任务。昆仑芯P800提供了强大的算力支撑，确保模型能够高效处理海量数据与复杂算法，同时支持单任务5000卡规模的并行计算。这一结合不仅优化了模型计算的效率，更使得模型在性能表现上达到了新的高度，在通用和垂类任务评测中展现出SOTA水平。Qianfan-VL模型具备三大特点:

多尺寸模型满足不同场景需求:提供3B、8B、70B三种规格的模型，让不同规模的企业和开发者都能找到合适的解决方案。

提供思考推理能力:8B和70B模型支持通过特殊token激活思维链能力，覆盖复杂图表理解、视觉推理、数学解题等多种场景。

OCR与文档理解能力增强:主打OCR全场景识别和复杂版面文档理解两大特色能力，在多项基准测试中表现优异，为企业级应用提供高精度的视觉理解解决方案。

1、模型性能与效果

（1）通用能力基准测试表现

在通用能力基准测试中，Qianfan-VL 系列模型（3B、8B、70B）展现出显著核心优势。从视觉理解到专业领域问答，模型性能随参数规模增大提升显著，体现出很好的Scaling趋势。在 ScienceQA 等专业问答测试中，精准度表现突出;多模态任务如 RefCOCO 等，物体识别与关联能力优异;同时，在各类通用基准测试里，相较主流模型，整体表现也颇为亮眼，充分彰显出在视觉理解通用能力上的出色实力，为不同场景下的智能应用提供了有力支撑。

（2）OCR与文档理解基准测试表现

Qianfan-VL系列模型（3B、8B、70B）在 OCR 与文档理解领域尽显卓越实力。一方面，具备OCR全场景识别能力，能精准识别手写体、数学公式、自然场景文字，还可对卡证票据信息进行结构化提取;另一方面，复杂版面文档理解能力突出，可自动分析版面元素，精准解析表格、图表，实现文档智能问答与结构化解析。从基准测试表现看，在 OCRBench、各类专业测试中，相较于主流模型，成绩优异且随参数规模提升持续向好，为企业级应用提供了高精度的视觉理解解决方案，有力推动文档智能处理场景的高效落地。

（3）数学解题基准测试表现

Qianfan-VL系列的8B和70B模型，在思考推理能力方面表现卓越。它们支持通过特殊token激活思维链能力，能覆盖复杂图表理解、视觉推理、数学解题等多类场景。这类任务需结合视觉信息与外部知识进行组合推理，而模型通过融合大量视觉类、文本类推理数据并用于后训练，从benchmark表现来看，推理计算相关任务效果显著提升。

在核心推理应用场景上，复杂图表理解与推理方面，可从复杂图表提取关键信息，进行数据分析、趋势预测、关联推理及统计计算;数学解题与视觉推理领域，能实现几何推理、公式识别、分步求解与逻辑推断。从数学解题基准测试表现看，在MathVista-mini、MathVision等多项测试中，相较于主流模型，成绩优异且随参数规模提升持续向好，为复杂推理场景下的应用提供了强力支持。

2、模型架构设计与技术特色

Qianfan-VL通过先进的多模态架构设计，凭借持续预训练和三大技术创新，实现了领域增强的通用视觉-语言能力。

整体架构

能力增强训练方案:创新的四阶段训练策略，在保持通用能力基础上实现领域能力显著提升

高精度数据合成管线:构建面向多模态任务的大规模数据合成管线，涵盖文档识别、数学解题、图表理解、表格识别、公式识别、自然场景OCR等核心任务，通过精细化的管线设计和中间过程数据构造，实现高质量训练数据的规模化生产。

昆仑芯驱动大模型高效计算:基于百度自研昆仑芯P800芯片，构建了业界领先的超大规模（5000卡）分布式计算系统，通过创新的并行策略和算子优化，显著提升大模型任务的处理性能与运行效率。

3、模型应用案例

（1）OCR识别场景

（2）数学推理场景

（3）文档理解场景

除上述场景应用案例外，Qianfan-VL同样可应用在图表分析、视频理解等场景中，均呈现出卓越的模型效果。

Qianfan-VL系列模型的开源，对百度智能云千帆来说，更像是“把模型放进真实生产力场景”的第一小步;未来，百度智能云会秉持着对技术的执着追求与对应用场景的深度洞察，不断推出全新的产业级模型，全方位助力AI技术在各行业落地。

（推广）

特别声明：以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布，本平台仅提供信息存储服务，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任，相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述法律文件后，将会依法依规核实信息，沟通删除相关内容或断开相关链接。

相关推荐

关键词：

荐AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.5-VL；GPT-5.1“隐身”登场

本期AI日报聚焦多项技术突破：月之暗面开源AI代理框架Kosong，支持异步编排与插件化设计；Replit推出AI集成功能，可一键调用300+模型；商汤发布空间智能模型SenseNova-SI，性能超越GPT-5；百度推出多模态模型ERNIE-4.5-VL，新增图像思考能力；谷歌地图全面AI化，集成Gemini实现智能交互；ChatTutor上线可视化教学系统，覆盖多学科实时推演；新版Google Finance引入AI深度搜索与财报追踪；OpenAI低调上线Polaris Alpha模型，支持256K上下文并更新知识库至2024年10月。

AI代理开源框架异步编排
荐AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT群聊功能；百度发布多模态 AI助手超能小度

本期AI日报聚焦多项技术突破：World Labs推出Marble 3D模型，实现多模态生成可交互虚拟世界；OpenAI在韩新试点ChatGPT群聊功能，支持多人协作互动；苹果更新隐私政策，要求第三方AI调用需明示授权；百度发布多模态助手“超能小度”，支持空间感知与设备免费升级；LinkedIn推出AI人脉搜索，通过自然语言精准匹配专业人士；Cursor完成23亿美元融资，估值达293亿；Character AI与耶鲁合作实现音画同步技术Ovi；Google NotebookLM上线深度研究工具，支持多格式文件分析与知识库构建。

AI 3D虚拟世界多模态输入
Billus AI高交会全球首发多模态大模型以AI Agent重构创意产业文明进化路径

2025年11月15日，Billus AI在高交会首发多模态大模型Billus0.57EDIT及“超级员工智能体”初阶版，依托自研生存式大模型与AI Agent技术，打破创意领域垂直局限，构建覆盖文创、时尚、艺术等全场景智能创作生态。该模型通过自然语言指令直达创意成果，实现从平面图到施工图的全流程高效生成。同时，Billus AI同步打造“创意设计超级员工+产业链智能体”体系，探索生成式创意与供应链智能推荐的新商业路径，助力行业从“经验驱动”向“数据智能”跃迁。

高交会 Billus毕鲁斯多模态大模型
百度智能云联合昆仑芯、HAMi，落地双模式算力调度方案，提升算力利用率

百度智能云联合昆仑芯与CNCF开源项目HAMi，推出基于昆仑芯P800的XPU/vXPU双模式算力调度方案。该方案已在金融客户集群落地，支持智能客服、营销辅助等十余类AI业务，兼顾稳定性与灵活性。XPU整卡模式通过拓扑寻优调度保障大规模训练性能，vXPU虚拟化模式以多粒度切分实现单卡多任务，最大化资源利用率。双模式协同让国产算力高效匹配业务需求，同时提供自动化调度与人工调节结合的灵活管理能力。

XPU/vXPU双模式昆仑芯P800 算力调度
百度搜索推出“百度猎户座”AI引擎，涵盖基座模型、搜索AI API、 MCP、垂类优势能力

2025年11月13日，百度发布“百度猎户座”AI引擎，全面开放25年搜索技术与前沿AI能力。该系统整合底座模型、搜索API、MCP及垂直领域能力，基于多智能体架构统一连接信息、工具、服务与模型，融合搜索技术优势与全网MCP生态资源。即日起对外开放，支持企业快速接入打造专属AI应用。同时，文心助手上线个性化记忆功能，视频生成推出“参考生成”玩法，AI短剧创作平台免费提供超30万部IP资源及全流程工具。

百度猎户座 AI引擎搜索技术
百度文库网盘发布GenFlow3.0，活跃用户超2000万，成全球最大通用智能体

11月13日，百度世界2025大会在京召开，正式发布GenFlow3.0通用智能体，活跃用户超2000万。基于此，百度文库、网盘全面升级，推出Office+Agent与GenX+++Agent两大智能体，支持办公套件操作及跨模态创作，并强化记忆中心与自由画布功能。同时，百度网盘全球上线，文库推出海外AI平台Oreate，9月新版登顶Product Hunt日榜。产品助力用户成为“超级个体”，覆盖工作、学习与生活全场景。

百度文库百度网盘 GenFlow3.0
“大叔不理解但照做”走红本人回应：纯属意外

近日，一段以“大叔不理解但照做”为主题的短视频在网络上迅速蹿红，引发了网友们的广泛关注和热烈讨论。视频中，一位大叔误入云南永善县溪洛渡艺术团在上海机场步道的舞蹈拍摄队伍，在未完全理解情境的情况下，仍跟着摆出了一个动作，这一可爱且充满反差萌的举动，让视频的“快乐指数”极速飙升，全网都开始寻找这位神秘的“飞天大叔”。

短视频网络热点反差萌
AI视觉重塑质检“智慧之眼”，聚焦四大核心应用场景

AI视觉质检技术正以精准化、场景化、智能化为核心驱动力，推动测试测量领域从传统人工/2D检测向“3D全维度+AI深度赋能”跨越升级。2026年慕尼黑上海电子生产设备展将汇聚超千家电子制造企业，集中展示焊接工艺缺陷检测、元件贴装质量排查等核心应用场景的解决方案。头部企业将通过3D成像+AI识别、X射线智能检测等技术，实现微米级缺陷精准捕捉与全流程数据闭环管理，

AI视觉质检 3D全维度检测电子制造展会
百度AI：熬过“起大早”的孤独，等来时代的奖励

AI的故事，又进入到了新阶段。 11月13日，第20届百度世界大会举行。在这场被视为AI行业风向标的会议上，百度创始人李彦宏发表了题为《效果涌现》的主旨演讲。他表示，当前，“我们更关心如何让AI与我们要做的每一项任务，都能有机结合，让AI成为企业发展和个人成长的原生推动力。” 这场演讲的核心，恰恰道出了AI产业的分水岭——从“智能涌现”迈向“效果涌现”。

AI 百度世界大会李彦宏
荐AI日报：谷歌Gemini 3 Pro Preview模型上线；Cloudflare文件异常致全球宕机；百度Q3 AI收入96亿元

谷歌发布Gemini 3大模型及Antigravity AI开发平台，支持参数灵活调整；Cloudflare因配置异常致全球服务中断6小时；微软测试AI文件连接器，允许Claude直接读取本地文件；百度Q3 AI收入96亿元，萝卜快跑订单激增；小米AI眼镜新增直播与语音控制功能；TikTok推出AI内容推荐调节选项；微软将Copilot全面集成至Office应用；谷歌推出实时生成交互界面的Generative UI技术；Manus发布Browser Operator，将浏览器升级为全功能AI代理。

AI Gemini 3

今日大家都在搜的词：

热文

3 天
7天

百度智能云Qianfan-VL系列模型开源！全尺寸领域增果优异，全自研芯片计算

荐AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.5-VL；GPT-5.1“隐身”登场

荐AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT群聊功能；百度发布多模态 AI助手超能小度

Billus AI高交会全球首发多模态大模型以AI Agent重构创意产业文明进化路径

百度智能云联合昆仑芯、HAMi，落地双模式算力调度方案，提升算力利用率

百度搜索推出“百度猎户座”AI引擎，涵盖基座模型、搜索AI API、 MCP、垂类优势能力

百度文库网盘发布GenFlow3.0，活跃用户超2000万，成全球最大通用智能体

“大叔不理解但照做”走红本人回应：纯属意外

AI视觉重塑质检“智慧之眼”，聚焦四大核心应用场景

百度AI：熬过“起大早”的孤独，等来时代的奖励

荐AI日报：谷歌Gemini 3 Pro Preview模型上线；Cloudflare文件异常致全球宕机；百度Q3 AI收入96亿元

今日大家都在搜的词：

热文

华为Mate X7外观公布搭载全新折叠玄武架构

AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；

董明珠再回应玫瑰空调：创新尝试打造家电艺术品

华为Mate X7今日开启预订搭载第二代红枫影像等配置

苹果回应iPhone17PM被湿巾擦掉色：高浓度酒精或是诱因

参与开发iPhoneAir设计师离职转投AI初创公司

AI日报：谷歌Gemini 3 Pro Preview模型上线；Cloudflare文件异

华为FreeBuds Pro 5悦彰耳机价格公布：1449元支持星闪音频

小米端到端辅助驾驶“Xiaomi HAD增强版”将于11月12日发布

小米AI眼镜推出1.4.16.0固件版本支持英语口语陪练

华为Mate 80系列已在华为商城开启预约

华为Mate 80 Pro Max外观公布：采用双圆环设计

华为Mate 80/Pro/Pro Max/RS开启预约：全系直屏设计

AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大

华为Mate X7外观公布搭载全新折叠玄武架构

阿里巴巴回应千问崩了：状态良好欢迎来问

AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；

荣耀500系列官宣将于11月24日发布

小米超级小爱AI大模型推出随心修图功能

一加Ace 6T官宣将于本月发布：首发骁龙8 Gen5

站长商机