11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
智元机器人合伙人在2025世界机器人大会上发表演讲,系统阐述了公司在具身智能领域的探索成果与未来方向。公司已发布多款机器人产品,建成规模化生产线与训练场,并在算法领域实现多项创新。为解决数据难题,智元开源了AgiBot World百万真机数据集,并推出具身智能基座模型GO-1,该模型在三大场景测试中表现优异。公司创新性地提出"本体-数据-模型-场景"全栈布局理念,通过飞轮迭代逻辑加速技术突破。智元还推出GE Bench评测工具,并计划下半年发布新一代机器人AgiBot G2。过去一年,智元已在柔性制造、物流分拣等多个场景取得突破性应用成果。
据媒体报道,谷歌DeepMind正式发布了其新一代通用世界模型Genie 3。 该模型能够根据用户的文本提示,快速生成丰富多样的交互式虚拟环境。Genie 3不仅能够以每秒24帧的速度生成720p分辨率的高清交互式3D世界,更创新性地引入了 可提示世界事件” 功能。用户通过简单文本指令,即可实时修改虚拟环境,显著提升了沉浸感与创造力。 DeepMind视Genie 3为迈向通用人工智能(AGI) 的�
AI日报栏目聚焦人工智能领域最新动态:1)Claude Opus4.1发布,编程能力提升74.5%;2)OpenAI开源GPT-OSS-120B和20B模型;3)谷歌DeepMind推出革命性3D世界模型Genie3;4)谷歌Gemini新增AI故事书生成功能;5)ElevenLabs推出商用AI音乐生成器;6)百度智能云发布首批AI数字员工;7)OpenAI估值或达5000亿美元;8)00后创业者推出云端AI协作开发工具Vinsoo;9)腾讯启动2026校园招聘,重点培养AI人才;10)马斯克宣�
上海码极客在WAIC2025展会上展示了四大核心产品线:1)MAGX系列空间智能本体,赋予机器感知与行动能力,其中智能卸货机器人效率提升33%;2)UU系列多模态交互智能体,包括随身AI助手UU Holo和视频分析智能体UU Video Agent;3)工业AI检测产品,如Mini LED AOI和晶圆外观检测设备;4)城市治理空间智能体"悠然智擎",实现全域感知与智能决策。公司由申恒涛院士领衔,拥有200+自主知识产权,服务500+头部客户,致力于通过空间智能和多模态世界模型技术推动产业智能化升级。
7月27日,腾讯混元3D世界模型1.0在魔搭社区开源首发。这是业界首个开源的沉浸式3D世界生成模型,支持文字/图片输入快速生成完整3D场景,将原本需要数周的建模时间缩短至几分钟。该模型显著提升了游戏开发、VR、数字内容等领域的创作效率,开发者可免费下载体验,还能通过魔搭社区提供的4000+MCP服务和调试工具进行优化训练。作为中国最大AI开源社区,魔搭已汇聚500+机构、7万+模型,覆盖36个国家1600万开发者。此前腾讯开源的混元MoE模型Hunyuan-A13B也在该社区首发。
面向用户意图理解,可灵团队提出的Any2Caption按照一种统一的方式理解多模态用户输入信息,进而生成语义丰富的结构化描述,可显著提升视频生成的成功率……
智能泊车方面,蔚来世界模型NWM展现出了显著优势。它具备360超视距车位识别能力,无需车辆处于特定起点位置,用户可在任意位置、任意挡位下发起泊车指令。这一特性极大地提高了泊车的便捷性和灵活性,让用户不再受传统泊车方式的限制。在泊车过程中,NWM能够实时规划泊车轨迹,确保车辆准确、高效地停入车位。同时,它还支持借用通道实现长距离漫游泊车,即使面�
对物理的直观理解是人类认知的基础:期望物体的行为,具有可预测性,也就是说,物体不会突然出现或消失,穿过障碍物,或随意改变形状或颜色。这种对物理的直观理解在更多物种中得到证实,包括猴子、鲸鱼、乌鸦等。这充分展示了V-JEPA模型对直观物理理解的稳健性,即使是较小的模型也能实现对直观物理的有效理解。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、百度:将在未来几个月推出文心大模型4.5系列并于6月30日起正式开源今日,百度公司宣布将在未来几个月推出文心大模型4.5系列,并计划于6月30日正式向公众开源。尽管删除了这些警告,ChatGPT仍然会对某些不当内容进行审查。
2024年,是AI指数级发展的又一年。大模型浪潮滚滚向前,在技术创新和应用落地上取得多项突破,引起了海内外广泛关注和讨论。“AI新榜”会继续和你一起见证、参与AI行业的风起云涌。