11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
2026年5月29日,WorldArena视频质量赛道最终结果揭晓。考拉悠然联合上海码极客、同济大学空间智能团队打造的悠然无界世界模型,开源版BLM获全球第一,闭源版BWM-Fast获全球第二。该模型以数据增强、智能增广策略提升数据利用效率,基于DiT架构引入首帧引导、动态记忆及双通路动作控制,在时空连贯性、动作可控性与物理一致性上全面领先,大幅降低训练成本。WorldArena从六大
27岁的北大本科、普渡直博、卡内基梅隆博士后、现任港大助理教授陈佳玉,用5年完成本硕博一体化研究,成为具身智能与强化学习领域一流学者。他通过原力无限发布的双臂协作演示,展示了基于因果世界模型的机器人自主执行能力——机器人不仅能完成桌面清扫等长程任务,还能在持续执行中根据实时状态动态调整策略,而非依赖预编程或简单视觉识别。这标志着从“看见未来”到“理解行动后果”的转变,因果世界模型正重新定义机器人的思维方式。
今日,小米正式发布并开源Xiaomi OneVL自动驾驶模型。 该模型在业内率先实现VLA、世界模型、潜空间推理等多个技术路线的统一,在具备XLA模型强悍推理能力的基础上,大幅提升了推理的速度和精度,是行业内具备开创性的方案。 其在精度上超越显式CoT、在速度上对齐仅答案”预测的潜空间CoT方案。过去,VLA和世界模型是自动驾驶领域两条相对独立的技术路线:VLA专注于理解�
【AI日报】栏目今日聚焦AI领域热点:小红书首提“AI治理主张”,抵制AI侵权造假;荣耀YOYO接入DeepSeek-V4大模型,提升交互体验;网易有道云笔记发布“LLM Wiki”套件,重新定义AI知识管理;灵光App推出“体验世界模型”功能,上传图片即可生成3D世界;小米开源VLA大模型后训练全流程,实现机器人亚毫米级操作;OpenClaw新版本默认使用DeepSeek V4 Flash,强化多模态协作;美团“小�
蚂蚁集团旗下灵光(LingGuang)App正式推出 体验世界模型” 功能,成为业界首个可在移动端直接体验世界模型的AGI产品。 用户只需上传一张图片,即可在手机上生成最长60秒的可探索3D世界。系统支持手游式操控视角,用户可以像玩游戏一样在其中自由走动探索从触发指令到开始探索,响应时间仅需秒级。 这是业内首次实现世界模型在移动端侧运行,具备分钟级的长时一致性�
今晚,蔚来乐道L90智能焕新发布会上,2026款乐道L90正式上市,共推出5款配置。 其中六座版分为Pro、Max 、Ultra 三个配置,整车购买26.58-29.98万元、电池租用方案购买17.98-21.38万元。 七座版分为Max 、Ultra 两个配置,整车购买分别为28.58、29.98万元、电池租用方案购买分别为19.98、21.38万元。 作为年代改款,26款L90升级智能硬件与外观细节,车身新增紫金和银紫两款双色车身、新�
今日,阿里发布可实时构建和交互的世界模型产品HappyOyster(快乐生蚝),该模型基于原生多模态架构而建,支持多模态理解与音视频联合生成。 目前,HappyOyster可实现漫游(Wander)和导演(Direct)两大核心能力,用户可实时构建可互动、可演绎、可探索的AI数字世界。 用户生成的数字世界不仅能被完整保存,还能开放给其他用户进行二次创作。 据悉,该产品由阿里ATH创新�
本期AI日报聚焦多领域进展:阿里巴巴推出开放世界模型Happy Oyster,支持实时交互;腾讯开源混元3D世界模型2.0,可一键生成可编辑3D资产;谷歌发布Gemini-TTS模型,支持近70种语言,语音更自然;蚂蚁灵波科技开源LingBot-Map,实现单摄像头实时三维重建。同时关注Anthropic即将发布Claude Opus 4.7及AI设计工具,以及湖南广电AI转型成果。安全方面,报告揭示MCP协议漏洞或致超20万台AI服务器面临风险,而OpenAI更新Agents SDK,引入沙箱功能以提升智能代理安全性。
今日,腾讯正式发布并开源混元3D世界模型2.0(HY-World 2.0)。 官方表示,该模型一句话就能生成3D资产,并直接导入到游戏制作或具身仿真引擎,实现真正的可玩、可用。 具体来说,用户完全不需要懂任何复杂的3D软件,只要像平时说话一样输入一句文字描述,或者直接上传一张图片,模型就能精准解析复杂的语义。 随后,它会一键生成混合了3D高斯泼溅(3DGS)与Mesh表征的�
小米汽车官方回应了车主关心的技术路线问题,明确XLA与世界模型并非二选一,而是互相配合,共同提升辅助驾驶能力。 不少用户担心小米转向XLA架构后,会放弃之前的世界模型技术。官方直接说明,两者不是对立关系,在全新的Xiaomi XLA架构里,已经无缝接入了强化学习加世界模型技术。 这里的XLA,就是小米给新一代SU7做的辅助驾驶底层大模型架构(Xiaomi XLA认知大模型)�