首页 > 业界 > 关键词  > 大模型发展最新资讯  > 正文

对话智源研究院王仲远:做具身智能的“安卓系统”,而非专用的“iOS”

2025-06-09 08:38 · 稿源: 硅星人Pro公众号

大模型的发展正在遭遇瓶颈。随着互联网文本数据被大规模消耗,基于数字世界训练的AI模型性能提升速度明显放缓。与此同时,物理世界中蕴藏着数字世界数百倍甚至千倍的多模态数据,这些数据远未被有效利用,成为AI发展的下一个重要方向。在2025北京智源大会上,智源研究院发布了“悟

......

本文由站长之家合作伙伴自媒体作者“硅星人Pro公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 多模态训练提速45% 百度智能云推出开源全模态训练框架

    多模态大模型时代,训练基础设施正面临结构性错位。传统框架基于“数据同质、结构单一、平台固定”设计,难以应对多模态异构数据、模型组件协同及跨平台算力需求。百度百舸开源的全模态训练框架LoongForge,以Megatron为核心引擎,通过统一模型抽象、系统层优化和硬件插件化设计,实现“一套代码多平台运行”。其CCT通算传并行、ChunkPipe流水线并行、自适应FP8等技术,在主流模型上实现15%-45%端到端训练加速,在DeepSeek等前沿架构上实现倍级性能提升,并在5000+卡昆仑P800集群上达到90%+线性扩展效率。

  • 北京亦庄设立大模型生态服务站 助力AI产业合规发展

    2026年4月,经北京市网信办认定,亦庄模数世界大模型生态服务站正式成立,为企业提供公益大模型备案辅导、产业生态对接等一站式服务。该站由市网信办授权、经开区信息技术产业局指导、北京国际算力服务公司运营,采用“1对1精准陪跑+集中培训”模式,可将备案周期压缩50%以上,解决企业合规认知不足等行业痛点。同时,经开区对完成备案的优质大模型企业给予100万元专项奖励及1亿元算力、模型、数据券等支持,常态化开展合规培训与产业对接,助力北京经开区加快构建全域人工智能之城。

  • 真实世界数据飞轮:灵初智能正在构建具身智能的新护城河

    具身智能行业共识:缺乏真实世界数据难以训练出可落地的机器人。不同于语言模型和自动驾驶,机器人需学习复杂物理交互,涉及视觉、语言、空间、触觉等多模态融合。摩根士丹利指出,机器人“大脑”技术未定型,真实世界数据正成为核心壁垒。灵初智能通过自研数据采集方案ψ-SynEngine,大幅降低成本并积累10万小时人类手部操作数据,开源首批1000小时数据集。其核心在于构建“数据—模型—执行—反馈—再训练”闭环,让每次场景落地转化为数据积累,推动模型持续进化。未来竞争将聚焦于稀缺、有效、可持续的真实世界数据掌控能力。

  • 小米自动驾驶模型Xiaomi OneVL开源:业内率先统一VLA、世界模型路线

    今日,小米正式发布并开源Xiaomi OneVL自动驾驶模型。 该模型在业内率先实现VLA、世界模型、潜空间推理等多个技术路线的统一,在具备XLA模型强悍推理能力的基础上,大幅提升了推理的速度和精度,是行业内具备开创性的方案。 其在精度上超越显式CoT、在速度上对齐仅答案”预测的潜空间CoT方案。过去,VLA和世界模型是自动驾驶领域两条相对独立的技术路线:VLA专注于理解�

  • 双奖加冕!中移互联网携“梧桐数盾”“梧桐数御”亮相第三届数据要素创新发展大会

    第三届数据要素创新发展大会上,中移互联网公司携“梧桐数盾”与“梧桐数御”两大方案亮相,并凭借可信数据空间方案获双奖。“梧桐数盾”以手机号身份和SIM卡密钥构建可信授权机制,解决数据共享中的隐私与安全难题,已在供应链金融、医保理赔等场景应用,实现数据不出域、快速理赔。“梧桐数御”聚焦账号全生命周期风控,以实时决策引擎为核心,在短视频平台规模化应用,提升黑产识别率13%,风险用户识别准确率超95%。未来,中移互联网将深化产业合作,构建数据流通新生态。

  • 小米自研AI大模型!Xiaomi MiMo再次登顶全球第一

    小米官方今天发文宣布,小米技术官方宣布,在OpenRouter平台最新数据中,Hermes Agent登顶全球调用量榜首,日Token调用量达2910亿,周调用量超1.75万亿。 小米自研MiMo模型成为第一大贡献模型,近一个月累计贡献1.45万亿Token调用量。

  • 福瑞泰克FUGA 4.0重构智驾数据中枢:大模型赋能,从“浅挖”到“深算”

    在智驾行业硬件趋同、算法收敛的背景下,数据成为技术制高点争夺的核心。福瑞泰克升级的FUGA 4.0数据平台,以AI大模型为核心,从海量数据中精准提炼“黄金场景”,实现从浅挖掘到真理解的跨越。其“大模型大脑+轻量级小脑”架构,兼顾泛化能力与精准度,显著提升通用场景识别、复杂路口理解和运动预测能力。该平台已进入大规模实战阶段,每月挖掘数十万高价值场景并精准标注,大幅缩短算法开发周期,助力仿真环境实现“日行百万公里”的高效迭代,从记录者升级为智能驾驶的守护者与领航员。

  • AI日报:千问PC端上线AI语音输入;字节发布全模态大模型Doubao-Seed-2.0-lite;谷歌更新AI搜索功能

    本期AI日报涵盖多项重要进展:千问PC端上线AI语音输入,提升办公效率;字节跳动发布全模态大模型Doubao-Seed-2.0-lite,实现视频、图像、音频与文本统一理解;腾讯联合多所高校推出开源多模态深度搜索智能体方案OpenSearch-VL;月之暗面申请“KimiClaw”商标,或涉硬件领域;Mininglamp开源Cider和Mano-P,打造本地AI工作站;OpenAI携手硬件巨头发布MRC协议,解决GPU闲置浪费;谷歌升级AI搜索功能,整合Reddit等社交观点;xAI推出Grok Imagine API质量模式,提升图像生成写实度。

  • 改写语音交互行规,豆包大模型更稳了

    豆包大模型,又上新了。 2026年4月9日,原生全双工语音大模型Seeduplex正式发布,相比上一代半双工豆包端到端语音模型,新模型基于“边听边说”的全新框架设计,交互体验的自然感、顺畅度大幅提升,目前已在豆包App全量上线。 这意味着,前沿的全双工语音技术,第一次实现商业规模化落地。 而依托全双工语音技术,豆包的语音交互不再是机械式的一问一答,而是收放�

  • 小白不踩坑推荐:从低糖效果、均匀加热到物理不粘,全能电饭煲硬核详解

    根据《2025年中国电饭煲市场洞察报告》,高达41%的消费者会将旧电饭煲使用6至10年才更换。面对选购困境,2026年实测推荐九阳炫饭煲(九阳双驱0涂层电饭煲40N1U)。该产品凭借双驱IH加热技术实现粒粒喷香,0涂层钛+316L不锈钢内胆确保健康安全,真低糖技术有效降糖65.22%,一锅多用适配3-5人家庭,堪称全能优选。

今日大家都在搜的词: