首页 > AI头条  > 正文

英伟达开源新一代OCR代码推理 AI 模型,超越 OpenAIo3-Mini表现

2025-05-09 15:34 · 来源: AIbase基地

英伟达在技术界引起广泛关注,正式发布了其最新的 Open Code Reasoning(OCR)模型套装。这一模型的推出,不仅展示了英伟达在人工智能领域的创新能力,也为开发者提供了强有力的工具,助力他们在代码推理和生成任务中取得更好的成绩。

QQ_1746775988858.png

** 模型参数与架构:多样化选择 **

英伟达的 OCR 模型套装共包含三种不同参数规模,分别为32B、14B 和7B。这些模型均基于 Nemotron 架构进行训练,Nemotron 是一种为多语言和多任务学习优化的 Transformer 框架。这种架构的设计旨在提升模型的推理能力和适应性,使其能够更好地处理复杂的编程任务。

- **32B 模型 **:专为高性能推理和研究场景设计,能够提供顶尖的效果,适合需要大量计算资源的用户。

- **14B 模型 **:在降低计算需求的同时,依然保持了强大的推理能力,适合一般开发者使用。

- **7B 模型 **:针对资源受限的环境设计,仍然能够在基准测试中展现出竞争力。

** 无缝兼容与快速集成 **

除了基础模型,英伟达还推出了32B 模型的指令微调版本。该版本支持与多个主流框架(如 llama.cpp、vLLM、Hugging Face Transformers 和 TGI)无缝兼容,极大地方便了开发者的集成与使用。

** 卓越的推理能力:超越 OpenAI**

在 LiveCodeBench 基准测试中,OCR 模型展现出惊人的实力,全面超越了 OpenAI 的 o3-Mini 和 o1(low) 模型。这一成就不仅仅是技术参数的较量,更是实际应用中的完美体现。LiveCodeBench 是一个专注于调试、代码生成和逻辑补全等真实开发者环境的综合评估平台。

根据测试数据,OCR 模型在各项指标中均表现出色。例如,32B 模型的 LiveCodeBench 平均得分为61.8,代码竞赛得分为24.6,远超其他同类模型。

** 高质量数据集:奠定实力基础 **

英伟达能够取得如此成绩,离不开其精心打造的 OCR 数据集。该数据集专注于高质量代码的训练,强调指令遵循、推理能力和多步骤问题解决能力。这使得模型在处理复杂编程任务时,表现出色且稳定。

英伟达的 OCR 模型套装的发布,标志着开源技术的又一重大突破。它不仅为开发者提供了强大的工具,也为人工智能的应用提供了更广阔的可能性。未来,我们有理由相信,随着这类模型的不断优化与普及,人工智能将在编程和开发领域扮演越来越重要的角色。

  • 相关推荐
  • 联想发布端侧AI新技术 PC本地推理能力媲美 OpenAI-mini

    联想在Tech World大会上展示了其最新AI创新成果"联想推理加速引擎"。该引擎由联想联合清华大学、无问芯穹共同研发,专为高效AI PC设计,通过并行解码、算子融合优化及异构计算技术,显著提升本地推理速度并降低功耗。现场演示显示,搭载该引擎的AI PC解答高考数学题仅需13秒,性能媲美云端大模型但成本更低。联想CEO杨元庆表示,下一代AI PC将让用户体验到强大的本地推理能力。该技术通过软硬件协同优化,实现了推理速度提升、内存占用减少和能耗降低的显著效果。

  • AI日报:阿里通义千问Qwen3问鼎全球开源模型;Kimi长思考模型API发布;OpenAI发布新一代GPT-4.1模型

    【AI日报】汇总了近期AI领域重要动态:1)阿里通义千问3开源模型上线7天即登顶全球开源模型榜首,在指令遵循和推理能力上超越闭源模型;2)月之暗面推出Kimi长思考模型API,可解决复杂代码和数学问题;3)OpenAI发布GPT-4.1模型,性能提升显著;4)Google推出Gemini2.5Pro模型,提升开发者编码能力;5)联想发布"天禧超级智能体",具备多模态感知能力;6)腾讯元宝上线"对话分

  • 国产六大推理模型激战OpenAI?

    2025年春节前夕,DeepSeek-R1模型发布,标志着中国AI进入推理模型新时代。文章梳理了国产大模型发展历程:从2022年ChatGPT引发国内追赶OpenAI热潮,到2023年"百模大战",再到2024年"AI六小虎"格局形成。重点分析了六大国产推理模型(DeepSeek、百度、阿里、科大讯飞、字节、腾讯)的技术特点与市场表现,指出国产模型在性能上已接近GPT-4水平。特别强调科大讯飞星火X1凭借全国产化技术路线获得政企青睐,以及DeepSeek-R1以560万美元超低成本实现高性能的突破。文章还探讨了英伟达芯片断供危机下,国产全栈技术路径的重要性,认为自主可控将成为对抗国际不确定性的关键。最后指出,随着推理模型成为竞争焦点,国产大模型正从技术追随转向自主创新阶段。

  • 美国封锁没意义!揭秘华为384颗自研芯片方案 领先英伟达AMD一代

    快科技5月2日消息,美国封锁芯片对华出口,这让英伟达CEO黄仁勋倍感焦虑,因为他深知中国国产算力目前达到了怎样的水平。前段时间华为推出了AI算力集群解决方案CloudMatrix 384,这在外行看来似乎没有什么不同,但如果仔细剖析其影响可谓深远。按照华为的说法,CloudMatrix 384基于384颗昇腾芯片构建,通过全互连拓扑架构实现芯片间高效协同,可提供高达300 PFLOPs的密集BF16算力,接近达到英伟达GB200 NVL72系统的两倍。此外,CM384在内存容量和带宽方面同样占据优势,总内存容量超出英伟达方案3.6倍,内存带宽也达到2.1倍,为大规模AI训

  • 谷歌扩展Gemini的“AI帝国”,涵盖汽车、手和电视

    自推出 Gemini 以来,谷歌已开始将其与 Gmail、谷歌云端硬盘、谷歌文档等自家服务相连接。如今,其愿景是将 Gemini 植入更广泛的 “安卓生态系统”,包括智能手表、汽车、电视等……

  • 超越DeepSeek-R1,英伟达开源新王登顶,14万H100小时训练细节全曝光

    英伟达发布开源Llama-Nemotron系列模型,性能超越DeepSeek-R1。该系列包含三个版本:8B、49B和253B参数模型,其中253B的Ultra版本在推理吞吐量和内存效率上表现突出。关键技术包括:1)采用神经架构搜索优化模型结构;2)通过知识蒸馏和持续预训练提升性能;3)结合合成数据监督微调;4)在STEM领域进行大规模强化学习训练。Ultra版本在GPQA基准测试中达到开源模型最高水平,单节点8xH100即可高效运行。模型创新性支持"推理开关"功能,通过指令动态切换推理模式。训练流程包含五阶段优化,最终模型在数学推理和通用任务上均表现优异,部分基准超越专有模型。

  • 超越OpenAI、拿下全球双料第一,“AI吴彦祖”背后大模型SOTA了!

    超越OpenAI! 国产大模型突袭,AI语音生成天花板被重新定义了。 MiniMax最新发布Speech-02,同时拿下Artificial Analysis Speech Arena和Hugging Face TTS Arena两项全球权威语音基准测评第一!

  • AI日报:小米首个推理大模型开源Xiaomi MiMo;快手上线AI笔记工具“喵记多”;腾讯拆分AI团队

    本文汇总了AI领域最新动态:1)小米开源70亿参数大模型Xiaomi MiMo,在数学推理和代码竞赛中超越OpenAI和阿里模型;2)快手推出AI笔记工具"喵记多",简化笔记管理;3)Luma AI发布电影级镜头控制API,降低视频生成门槛;4)腾讯重组AI团队,加大语言模型研发投入;5)Anthropic为Claude引入新语音"Glassy";6)谷歌NotebookLM新增50+语言音频概述功能;7)xAI将发布Grok3.5模型;8)Meta推出独立AI助手应用挑战ChatGPT;9)OpenAI紧急修复GPT-4o"谄媚"问题;10)Mac本地AI助手Simular升级隐私保护;11)CameraBench项目帮助AI理解镜头运动;12)谷歌推出个性化语言学习AI工具。

  • 英伟达CEO黄仁勋造访白宫:希望特朗普修改AI芯片出口规则

    快科技5月1日消息,据媒体报道,美国当地时间周三, 英伟达公司首席执行官黄仁勋造访白宫时表示,他希望特朗普政府修改从美国向全球出口人工智能(AI)技术的相关法规,以便美国企业能更好地抓住未来的机遇。我们需要加速美国AI技术在全球的扩散,”黄仁勋在与媒体的简短会面中表示,政府的政策和鼓励措施必须真正支持这一点。”与此同时,黄仁勋还呼吁美国政府放宽人工智能图形处理单元出口规定,但媒体报道特朗普政府计划加强控制。众所周知,英伟达目前主导着用于训练AI模型的尖端AI芯片市场,但其向中国客户销售最先进产品的渠道已被?

  • 微软CEO:公司多达 30% 的代码是由 AI 生成的!

    微软首席技术官凯文·斯科特(Kevin Scott)曾表示,预计到 2030 年,将有 95% 的代码是由 AI 生成的……

今日大家都在搜的词: