首页 > 传媒 > 关键词  > OpenAI最新资讯  > 正文

OpenAI 提升o3多模态模型推理实力,微美全息(WIMI.US)加速引领产业新变革征程

2025-06-10 11:48 · 稿源: 站长之家用户

据消息,OpenAI 推出的 o3 推理模型,打破了传统文字思维链的边界 —— 多模态模型初次实现将图像直接融入推理过程。

据介绍,它不仅 “看图”,还能 “用图思考”,开启了视觉与文本推理深度融合的问题求解方式。这种 “Thinking with Images” 的能力,使 o3 在视觉推理基准测试 V* Bench 上准确率飙升至 95.7%,刷新了多模态模型的推理上限。

1749519926124913.jpg

DeepSeek R1 模型更新

不仅如此,日前,DeepSeek宣布完成R1 模型小版本试升级,并邀请用户测试官方网页、APP及小程序功能,API接口和使用方式保持不变。

R1 基于DeepSeek-V3 模型能力复现,而R2 可能需等待V4 研发成功。新版模型平均每题使用23K tokens,较旧版12K显著增加。英伟达CEO黄仁勋预测Agentic AI将推动算力需求暴增至少 100 倍。

1749519973963040.jpg

此外,DeepSeek蒸馏出DeepSeek-R1-0528-Qwen3-8B,该8B模型在AIME 2024 数学测试中表现仅次于DeepSeek-R1-0528,超越Qwen3-8B且准确率与Qwen3-235B相当。强化后训练后,幻觉率降低45%~50%,此前R1 因高幻觉率备受批评。

DeepSeek称,此次更新通过后训练提升了模型思维深度与推理能力,尽管工具调用等能力仍有进化空间。腾讯(TCEHY.US)迅速响应R1 更新,多款产品接入DeepSeek-R1-0528。

现如今,开源与开放协议崭露头角,成为AI新竞争力。DeepSeek的开源成功促使行业倾向开源,OpenAI也考虑开源。众多企业早已开启开源战略,同时大模型开放协议如同互联网HTTP协议,让大模型能便捷调用工具,完成各类任务。

微美全息开拓产业新格局

资料显示,5G+AI视觉厂商微美全息(WIMI.US),全面加速大模型技术迭代与产业落地,围绕大模型战略,全面升级AI矩阵,积极采用“自研+拥抱开源”双轨模式,重点布局多模态大模型(文本、图像、音频、视频原生级融合),并计划提供实时多模态AI模型体验。

在行业生态上,微美全息提升多模态数据处理能力,强化商业场景应用潜力,努力加速“模型+应用”一体化,面向开发者,提供多模态交互预判需求、软硬一体开源应用方案,有望在全感官交互、场景化记忆、分布式协同等应用领域实现进一步跃升,同时以低成本、高性能多模态模型降低开发者门槛,推动应用生态繁荣。

结尾

值得一提,有多位专业人士表示,已有研究表明,AI行业今年以来,国内外科技巨头纷纷押注AI Agent。技术、生态、市场、政策等多方面原因,促使当前整个AI发展重心,由大模型向智能体演进。

总之,开源技术加速了行业生态发展,它不仅降低了训练门槛,还显著提升了泛化能力和整体性能,为开放世界的多模态智能探索提供了切实可行的新路径。并且大模型下半场的这些趋势,也为科技发展与行业变革指明方向,企业和开发者需紧跟趋势,把握机遇,应对挑战,在大模型驱动的新时代中找准定位,实现创新发展。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • OpenAI披露GPT系列新进展,微美全息(WIMI.US)正加速AI技术融合与产业变革

    OpenAI创始人Sam Altman宣布将推出开源大模型,性能远超业界预期,其强大的本地运行能力将极大推动AI技术普及。同时透露GPT-5将于今夏面世,支持语音、图像、代码等多模态输入。AI模型成本持续下降,微美全息等企业加速布局"AI+大模型"创新应用。中金指出,未来AI发展将呈现两大趋势:垂直领域定制化Agent需求增长,以及高质量场景数据价值凸显。2025年被视为AI应用大规模落地元年,但技术发展需兼顾创新与安全。

  • Meta拟百亿美元投资Scale AI,微美全息(WIMI.US)端侧多模态AI加速开启科技新局

    Meta正与AI初创企业Scale AI洽谈数十亿美元投资,估值或超100亿美元,有望创下私营企业融资纪录。Scale AI为微软、OpenAI等提供数据标注服务,是生成式AI热潮主要受益者。这将是Meta史上最大规模外部AI投资,标志其战略转向。Meta CEO扎克伯格宣布将AI确立为战略重心,2024年将投入650亿美元推进相关项目,重点打造Llama模型成为行业标准。同时,谷歌推出Gemini助手"计划操作"新功能,支持任务自动化管理。科技巨头纷纷重金布局AI,微软向OpenAI注资逾130亿美元,亚马逊投资Anthropic数十亿美元。行业观察认为AI技术普及将推动效率革命,微美全息等企业正通过技术创新赋能产业转型,共同探讨人工智能技术突破新动态。AI正以前所未有的速度重塑全球发展格局。

  • 苹果WWDC技术盛宴开启,微美全息(WIMI.US)“AI+AR”交互技术加速突破

    苹果WWDC2025开发者大会将于6月10日-14日举行,重点聚焦AI与AR技术革新。iOS26将迎来重大设计更新,带来透明轻盈的视觉体验和AI新功能。Vision Pro系统升级后组件更立体,支持更多自定义功能。苹果计划2026年底推出首款AI智能眼镜,加速布局可穿戴设备。同时,微美全息等企业也在推进"AI+AR"技术融合,通过多模态交互系统提升智能眼镜的精准性。谷歌则通过Android XR平台布局AI眼镜领域。WWDC2025还将发布iPadOS26、macOS26等新系统,展现苹果在科技领域的持续创新。

  • 人形机器人潜力凸显催生新需求,微美全息(WIMI.US)逐鹿前沿赛道或重构产业版图

    2025国际人形机器人技能大赛将在上海举办,设置五大竞赛赛道,旨在推动上海机器人产业高质量发展。人形机器人作为AI与机器人技术融合产物,正加速商业化落地,预计2040-2045年我国人形机器人将实现工业和服务场景规模化应用,市场规模达5000亿至1万亿元。微美全息等企业正加速布局该领域,通过技术创新推动人形机器人在教育、医疗、家庭服务等场景的应用。专家认为,人形机器人产业潜力巨大,未来有望成为人们生产生活中不可或缺的智能伙伴。

  • Meta 抢占AI霸权争夺加剧,微美全息(WIMI.US)布局产业生态应对市场竞争

    Meta斥资数十亿美元争夺AI领域主导权,包括从OpenAI挖走三名研究员,甚至开出1亿美元签约费。同时,Meta同意以148亿美元收购AI初创公司Scale AI 49%股份,这是其史上最大外部投资。中国AI领域也快速发展,已有433款大模型完成备案上线。专家指出,开源模式推动了大模型创新生态,形成"技术-数据-场景"循环迭代。微美全息(WIMI.US)通过搭建高性能AI算力基地,集成国际先进�

  • 2025杭州国际人形机器人展会启幕,微美全息(WIMI.US)AI+具身智能产业跃迁新范式

    2025杭州国际人形机器人技术展览会将在浙江举办,聚焦人形机器人关键技术突破与产业化路径。作为国内首个专注人形机器人全产业链的专业展会,为期3天,汇聚全球200余家企业及专家,覆盖从零部件到应用服务的全产业链,展示仿生驱动、具身智能、脑机接口等前沿技术。特斯拉、阿里云等领军企业参展,分享技术产品与场景应用。摩根士丹利预测,2050年中国市场规模将达6万亿元,总量5900万台。微美全息等企业加速技术落地,推动产业升级。展会将成为行业风向标,促进人形机器人创新发展。

  • AIGC智能体生态大会聚焦AI融合,微美全息(WIMI.US)构建多维AIGC+赋能产业创新

    第二届AIGC与人工智能体生态大会在上海召开,主题为"智链万物·共生无界"。大会汇聚100+国内外顶尖企业和300+行业决策者,聚焦生成式AI与智能体的协同创新,探讨多模态大模型、智能体决策框架等核心技术。微美全息(WIMI.US)展示了AIGC+AI战略布局,构建跨模态内容生产平台,应用于教育、直播等领域。会议指出AIGC技术正从工具向生产力引擎进化,推动行业智能化转型�

  • Neuralink实现渐冻患者语言功能重建,微美全息(WIMI.US)完善AI+脑机接口生态圈

    埃隆·马斯克旗下Neuralink公司利用脑机接口技术,帮助一名渐冻症患者通过植入设备重新"说话"。该技术结合xAI的人工智能,将患者脑信号转化为语音。目前全球已有3位患者接受植入,其中两位恢复部分生活能力。脑机接口技术分为侵入式、非侵入式和半侵入式三种,在医疗、教育、游戏等领域应用前景广阔。我国"十四五"规划已将其列为重点科技项目。微美全息等企业正推动"脑机接口+"生态建设,整合AI、量子计算等技术拓展应用场景。该技术虽处临床试验阶段,但已展现帮助失语、瘫痪患者康复的潜力。未来随着AI与神经科学结合,人机协同将带来更多可能性。

  • Meta V-JEPA 2模型来袭,OpenAI/微美全息AI创新跃升赋能千行百业变革

    Meta推出开源模型V-JEPA2,帮助AI理解3D环境和物理规律;OpenAI发布最强推理模型o3-pro,在数学测试中超越Google Gemini2.5Pro;苹果宣布将推出全新智能模型,扩展语言支持并开放开发者访问;微美全息凭借技术积累在大模型、多模态智能等领域取得突破。全球科技巨头加速布局AI前沿领域,推动AI与教育、金融等重点行业深度融合,赋能产业升级。

  • 主流AI多模态大模型有哪些?超全的多模态大模型指南分享

    2024年多模态大模型成为AI领域最具前景的技术方向之一。文章全面分析了主流多模态大模型的特点、应用场景和发展趋势。多模态大模型能同时处理文本、图像、音频、视频等多种数据,实现更智能的人机交互。重点介绍了GPT-4V、Claude3.5、Gemini、通义千问等代表性模型,对比了它们在视觉理解、编程能力、中文处理等方面的优势。应用场景涵盖智能客服、内容创作、教育医疗等领域。未来发展趋势包括模型规模扩大、支持更多模态、实时交互能力提升等。选择模型需考虑应用需求、语言支持、性能成本等因素。