首页 > AI头条  > 正文

百度飞桨PaddleOCR 3.0开源发布 OCR精度跃升13%

2025-05-22 09:07 · 来源: AIbase基地

2025年5月20日,百度飞桨团队正式发布了PaddleOCR3.0版本,并对外开源。这一新版本在文字识别精度、多语种支持、手写体识别以及高精度文档解析等方面取得了显著进展,进一步提升了PaddleOCR在OCR领域的技术实力和应用价值。

PaddleOCR自发布以来,凭借其学术前沿算法和产业落地实践,受到了产学研各方的喜爱,并被广泛应用于众多知名开源项目。此次发布的PaddleOCR3.0全面适配了飞桨框架3.0正式版,不仅提升了文字识别精度,还支持多文字类型识别和手写体识别,满足了大模型应用对复杂文档高精度解析的需求。此外,结合文心大模型4.5Turbo,PaddleOCR3.0显著提升了关键信息抽取精度,并新增了对昆仑芯、昇腾等国产硬件的支持。

微信截图_20250522090536.png

PaddleOCR3.0的核心亮点之一是全场景文字识别模型PP-OCRv5。该模型实现了单一模型支持简体中文、繁体中文、中文拼音、英文、日文五种文字类型,以及手写、竖版、拼音、生僻字等复杂文本场景的识别。与上一代相比,PP-OCRv5的整体识别精度提升了13个百分点,达到了业界领先水平。PP-OCRv5通过统一模型架构实现了多种文字类型的无缝识别,简化了部署流程,提升了识别的总体精度和速度。

在文档解析方面,PaddleOCR3.0推出了通用文档解析方案PP-StructureV3。该方案强化了版面区域检测、表格识别、公式识别的能力,增加了图表理解和多栏阅读顺序的恢复能力,并可以将结果转换为Markdown和JSON格式。PP-StructureV3在OmniDocBench基准测试中领先众多开源和闭源方案,展现了其在多场景、多版式PDF高精度解析方面的强大能力。

微信截图_20250522090722.png

此外,PaddleOCR3.0还发布了智能文档理解方案PP-ChatOCRv4。该方案原生支持文心大模型4.5Turbo,关键信息抽取精度相比上一代提升了15个百分点。PP-ChatOCRv4结合了大模型和小模型的优势,支持离线使用多模态文档理解模型PP-DocBee2,能够一站式解决版面分析、生僻字、多页PDF、表格、印章识别等复杂文档信息抽取问题。

PaddleOCR3.0的发布,不仅体现了百度在OCR技术上的持续创新,也为广大开发者提供了更加强大和易用的工具,助力开发者快速落地AI应用。

开源地址:

https://github.com/PaddlePaddle/PaddleOCR

  • 相关推荐
  • 百度第一!百度智能云一见领跑视觉大模型赛道

    IDC最新报告显示,百度智能云凭借"文心一言4.5"多模态大模型和"文心X1"深度思考模型,在视觉大模型领域综合实力排名第一。其智能云平台在算法模型、工程化落地、行业覆盖等方面优势显著,已服务餐饮、钢铁、电力等20多个行业,帮助数百家企业实现生产全环节的数字化管理。典型案例包括:为风电集团构建安全管控系统,巡检效率提升6-10倍;与中钢研合作金相分析模型,检测准确率达95%;助力连锁餐饮实现全国1000+门店服务质量量化管理,订单覆盖率从5%提升至95%。通过"云端大模型+边缘小模型"的协同架构,在保障精度的同时大幅降低应用成本,推动专业级视觉AI应用普及。

  • AI日报:腾讯混元开源Hunyuan-GameCraft;最强图像编辑器nano-banana发布;字节开源Agent专用模型 M3-Agent-Control

    本文介绍了AI领域最新动态:1)腾讯开源Hunyuan-GameCraft框架,可快速生成高质量游戏视频;2)Nano-Banana模型在图像编辑领域超越FLUX+Kontext;3)字节开源基于Qwen 3 32B的328亿参数M3-Agent-Control模型;4)Kimi将推出PPT生成功能;5)阿里1688将上线"诚信通AI版"会员服务;6)苹果智能家居中心推迟至2026年发布;7)万兴科技接入GPT-5;8)全球AI独角兽达498家,总估值2.7万亿美元;9)谷歌为Slides和

  • 百度搜索PC端全量上线AI功能

    百度对外宣布其搜索PC端首页已完成全量升级,将传统信息入口一举升级为任务中枢,为用户带来前所未有的智能搜索体验,进一步巩固了其在国内AI搜索行业的领先地位。 此次升级后的百度搜索PC端首页亮点纷呈。新增的“超级智能双行框”成为一大核心亮点,它支持用户一键进行深度搜索,无论是面对复杂的专业问题,还是多维度信息需求,都能快速给出精准且全面的解答

  • 汉数科技重磅发布「太擎3.0」丨开启人与 AI 的协作时代

    8月15日,汉数科技在广州发布"太擎3.0"AI协作平台,标志着企业数字化转型进入新阶段。该平台通过AI数字员工实现人机高效协作,覆盖销售、服务、管理三大核心场景。创始人陈开旺详解平台迭代路径:1.0版本构建AI技术底座,2.0版本推出智能体手机实现场景化应用,3.0版本创新性引入"仿生级AI智能体"技术,为企业提供具备岗位能力的数字员工。平台能降低中小

  • AI日报:昆仑万维发布SkyReels-A3模型;百度搜索PC端全面上线AI搜索;Grok 4 AI模型永久免费开放

    AI日报栏目聚焦人工智能领域最新动态:1)昆仑万维发布SkyReels-A3模型,实现语音驱动数字人生成;2)xAI宣布Grok4模型永久免费开放;3)OpenAI发布GPT-5提示词指南;4)百度PC端上线AI搜索功能;5)微软Windows Co pilot接入GPT-5;6)百川智能开源医疗大模型Baichuan-M2性能超越GPT-oss120b;7)苹果iOS26将集成ChatGPT-5;8)谷歌推出3D视觉编辑框架BlenderFusion;9)轻量级TTS模型Kitten TTS参数仅1500万;10)MiniCPM-V

  • AI日报:百度推全球首批AI数字员工;Claude Opus4.1出世;谷歌DeepMind发布世界模型Genie 3

    AI日报栏目聚焦人工智能领域最新动态:1)Claude Opus4.1发布,编程能力提升74.5%;2)OpenAI开源GPT-OSS-120B和20B模型;3)谷歌DeepMind推出革命性3D世界模型Genie3;4)谷歌Gemini新增AI故事书生成功能;5)ElevenLabs推出商用AI音乐生成器;6)百度智能云发布首批AI数字员工;7)OpenAI估值或达5000亿美元;8)00后创业者推出云端AI协作开发工具Vinsoo;9)腾讯启动2026校园招聘,重点培养AI人才;10)马斯克宣�

  • AI CRM如何跨越落地鸿沟?场景驱动与数据闭环成关键

    销售易发布中国首款AI CRM产品NeoAgent,标志着CRM行业进入智能化变革。该产品基于腾讯混元大模型+DeepSeek开源模型,提供多场景智能解决方案。AI CRM的核心价值在于数据驱动,通过构建统一客户数据平台,实现销售全流程智能化。目前已在客户服务、销售助理等场景落地,其中销售助理Agent可提升70%事务性工作效率。企业应用AI需关注数据基础与场景适配性,销售易通过"场景需求-产品供给-使用反馈-快速迭代"的闭环模式,推动AI CRM持续进化。在Agentic AI时代,数据能力成为企业智能化转型的关键竞争力。

  • 孩子脱鞋138cm补票后家长投诉退票 儿童票标准引热议

    8月18日,上海一女子带孩子游玩时因身高标准与游乐园产生纠纷。孩子脱鞋后身高138cm,符合1.1-1.4米儿童票标准,但穿鞋测量141cm被要求补差价。经投诉后园方退款。事件引发对儿童票仅以身高为标准的讨论,专家指出随着儿童身高普遍增长,该标准已不科学。部分景区仍简单以身高判定优惠资格,既缺乏人性化服务,也导致超高儿童无法享受优惠、身高不足成人能否优惠的两难问题。建议景区应综合考虑年龄等多元标准。

  • 告别“数据录入机器”:ToB智能体如何让CRM回归业务本质

    2025年腾讯全球数字生态大会上,销售易推出首款AI CRM产品NeoAgent,基于大模型技术重构企业销售流程。该产品通过语音指令自动完成客户拜访规划、关联历史数据并生成策略建议,实现从菜单点击到自然对话的交互变革。销售易通过"三阶跃迁"模式:解放双手的语音转结构化记录、突破菜单层级的智能检索、结合销售方法论的场景赋能,深度重构CRM系统。产品依托统一数据平台,实现多模态信息整合与权限管控,采用混合模型架构平衡响应速度与决策质量。目前已在米其林等企业应用中显著提升销售转化率,并通过"用户+流量"混合收费模式验证商业化路径。这标志着ToB领域AI正从效率工具向"数字同事"进化,其核心价值在于理解业务、适配场景并创造增量。

  • 从数字枷锁到智能伙伴:AI Agent正在系统性重构CRM价值逻辑

    微软CEO纳德拉提出AI Agent将彻底改变SaaS行业,以Copilot Workspace为代表的新型交互方式正在重塑CRM领域。Salesforce和销售易等企业已推出AI Agent产品,通过自然语言交互优化销售流程,解决传统CRM数据录入繁琐、决策滞后等痛点。AI Agent能自动分析客户数据、生成拜访计划、实时转录会议内容,并精准识别增量客户,将销售效率提升10倍以上。腾讯投资的销售易NeoAgent平台已上线渠道助理、营销Agent等产品,通过大模型与业务系统深度整合,实现从"流程固化"到"智能协同"的转变。这场变革标志着SaaS 2.0时代的到来——软件不再是工具,而是能理解意图、主动规划的数字员工。未来商业竞争的核心,将转向数据资产厚度与场景落地的精准度。

今日大家都在搜的词: