首页 > 业界 > 关键词  > OCR最新资讯  > 正文

只有0.9B的PaddleOCR-VL,却是现在的OCR模型。

2025-10-24 09:52 · 稿源: 数字生命卡兹克公众号

这几天,OCR这个词,绝对是整个AI圈最火的词。因为DeepSeek-OCR,甚至让OCR这个赛道文艺复兴,又给直接带火了。整个Hugging Face的趋势版里,前4有3个OCR,甚至Qwen3-VL-8B也能干OCR的活,说一句全员OCR真的不过分。然后在我上一篇讲DeepSeek-OCR文章的评论区里,有很多朋友都在把

......

本文由站长之家合作伙伴自媒体作者“数字生命卡兹克公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • AI日报:豆包输入法正式上线;混元开源HunyuanOCR模型;Claude Opus4.5发布

    本期AI日报聚焦多项技术突破:腾讯开源10亿参数OCR模型HunyuanOCR,在多场景实现SOTA性能;豆包输入法整合AI实现智能预测;Anthropic推出Claude Opus4.5提升推理效率;ChatGPT新增购物推荐功能准确率达64%;全球首款纯AMD训练MoE模型ZAYA1发布;微软推出本地运行助手Fara-7B;谷歌NotebookLM新增幻灯片生成功能;亚马逊Leo卫星网络启动企业测试,实现“卫星+云+AI”一体化通信。

  • DeepSeek同时发布两个正式版模型:DeepSeek-V3.2系列发布

    今日,DeepSeek正式推出V3.2系列模型,包含标准版DeepSeek-V3.2与长思考增强版DeepSeek-V3.2-Speciale。此次更新不仅在推理性能上实现重大突破,更通过创新性技术架构重新定义了开源模型的能力边界。 目前,官方网页端、移动应用及API服务已全面升级至V3.2标准版,而Speciale版本则以临时API形式开放供学术研究使用。 DeepSeek-V3.2在平衡推理效率与输出质量方面

  • 百度AI to C,需要一把新钥匙

    11月18日,百度发布今年第三季度财报,数据呈现出两大核心业务鲜明的对照。 以ACG为代表的百度智能云收入保持了高速增长。业绩电话会上,百度方面提到季度内AI云实现62亿元收入,同比增长21%。 当一众厂商在C应用上买量试错时,百度智能云这几年几乎把所有重心都放到了B端,并在金融、能源,以及不断扩大大企业、G端的客群规模。 而以MEG为代表的在线营销收入收缩,

  • AI日报:快手可灵 2.6 全量上线;字节Seedream 4.5发布;DeepSeek连发两款新模型

    本文汇总了AI领域最新动态:快手可灵2.6上线,实现“音画同出”生成视频;字节跳动发布Seedream4.5,提升多图一致性生成;豆包助手回应权限争议并下线微信操作功能;智源研究院推出多模态世界模型Emu3.5,可预测真实世界状态;研究揭示AI模型能发现并利用智能合约漏洞;小米公布AI战略,押注“AI+物理世界”融合;谷歌发布Workspace Studio,助力企业构建AI代理;DeepSeek同步上线V3.2与Speciale两款新模型,展示开源实力。

  • V3.2逼近Gemini 3,DeepSeek硬气喊话:接下来我要堆算力了

    ​就在上周,OpenAI前首席科学家、现SSI CEO Ilya Sutskever在最新播客访谈中抛出一个重磅观点,过去五年的“age of scaling”正在走到头,预训练数据是有限的,单纯用更多GPU堆更大模型,哪怕再放大100倍,也未必能带来质变。所以我们又回到了以研究为核心的时代,只不过这次有了巨大的算力”,这一表态被视作对Scaling Law撞墙论的强力佐证。 然而仅过了几天,12月1日,DeepSeek用V3

  • 网易有道词典2025年度词汇发布:DeepSeek当选!

    网易有道词典今天发布了2025年度词汇,deepseek以8672940次的年度搜索量成功当选。 有道词典表示,今年1月份,DeepSeek发布了深度推理模型R1,在复杂逻辑、数学与代码领域的表现跻身全球顶尖,并宣布全面开源。 这也使得2025年deepseek在有道词典的全球搜索量从0跃升至8672940,涨幅创下历史新高。

  • Anthropic推出AI模型Claude Opus4.5:编程能力超群 接近顶尖工程师

    Anthropic于11月25日正式发布旗舰AI模型Claude Opus 4.5并投入商用。该模型在编程、智能代理等领域表现卓越,尤其在处理复杂研究任务及电子表格、PPT制作等办公场景显著优于同类产品。专业测试显示其编程能力超越谷歌Gemini 3 Pro与OpenAI GPT-5.1,在软件工程师闭卷测试中甚至超过所有历史人类考生。同步更新的多款配套工具(如浏览器扩展、Excel增强功能)进一步强化技术生态。目前该模型已全面接入企业级服务,标志着Anthropic在AI商业化进程中的关键突破。

  • 诞生才一周年,MCP凉了

    11月25日,Anthropic 官方博客更新了一篇庆祝帖,宣布 MCP 正式满一周岁,配合发布的还有一份新版规范。 官方给出的数据看起来不错:MCP Registry 目前收录了近2000个 Server,比9月份刚上线时增长了407%。OpenAI 在3月宣布全面支持 MCP,Google、AWS、HuggingFace 等都将接入,从纸面上看,这是一个正在被行业接受的开放标准。 但这条周年庆消息在社交媒体上几乎没有激起水花,鲜有讨论。

  • “卷”不动了?让AI销售团队替你卷!百度商家智能体升级片来了

    百度商家智能体发布全新升级宣传片,宣布从“智能接待客服”向“有技巧的智能获客专家”战略演进。其核心在于构建“专属AI销售团队”,通过“规划大脑”引领、“多专家”协同及“全模态”交互的深度融合,旨在为商家提供从需求洞察到转化引导的全流程赋能。此次升级标志着百度在赋能商家数字化经营、破解转化难题上迈出关键一步。

  • 免费AI搜索指数平台DeepGEO上线,国内首创geo指数分析服务

    国内首个专注AI搜索指数分析及品牌产品排名的专业工具DeepGEO平台正式上线,核心功能全部免费开放。该平台融合百度指数等权威数据与自研AI预测算法,提供多维、跨平台的AI搜索行为分析,填补了市场空白。用户可免费查询各类AI产品、技术及企业的综合搜索指数与口碑排名,并获取趋势洞察与未来热点预测。平台旨在降低AI行业数据分析门槛,赋能创业者、投资者及研究者,推动产业健康发展。

今日大家都在搜的词: