续命Scaling Law？世界模型GPT-4o让智能体规划，OSU华人一作

2024-11-23 08:30 · 稿源：新智元公众号

Scaling Law又能续命了?如何通过语言智能体的高级规划来Scaling推理时计算?答案就是——使用LLM作为世界模型。也就是说，使用GPT-4o来预测网站上操作的结果，可以提供强大的性能，同时还能提高安全性和效率。近日，来自俄亥俄州立大学等机构的研究人员提出了一种全新的WebDreame

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

（举报）

相关推荐

关键词：

触觉增强世界模型引关注，一目科技IROS首秀定义机器人感知新维度

在2025年IROS大会上，中国AI企业一目科技凭借触觉感知与具身智能领域的突破成为焦点。公司展示了全球最薄仿生视觉触觉传感器，厚度大幅缩减，实现0.005N三维力分辨率和120fps输出帧率。CEO李智强提出"视觉-触觉-语言-行动"新范式，指出触觉能捕捉物理世界的隐秘维度。通过创新仿真平台和生成式AI技术，突破传统数据收集限制，显著提升机器人操作技能训练效率。现场机械臂成功演示易碎品抓取等复杂任务，验证了触觉感知在精细操控中的核心价值，为"操控即服务"产业愿景提供技术支撑。
荐AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear模型；MiniMax Music 2.0 发布

本期AI日报聚焦多领域创新：昆仑万维推出SkyReels V3模型，整合顶尖视频生成能力；月之暗面Kimi Linear模型处理长文本速度提升2.9倍；MiniMax Music 2.0实现专业级音乐创作；字节跳动启动豆包股权激励计划吸引AI人才；苹果iOS 27将迎AI重大升级，Siri更个性化；Dia浏览器融合Arc设计理念与AI技术；文心魔法漫画工具实现一键生成连载作品；谷歌Gemini Canvas新增PPT自动生成功能，由Gemini 2.5 Pro驱动，提升职场效率。

AI视频生成 SkyReels V3
荐AI日报：Sora免费额度要缩水；月之暗面发布Kimi Linear架构；Canva免费放出Affinity专业设计套件

本期AI日报聚焦多项技术突破：OpenAI调整Sora免费额度并推出付费计划，标志视频生成进入商业化；Figma收购Weavy推出AI设计工具；OpenAI发布基于GPT-5的安全研究助手Aardvark；全球首款AI字体生成器Dr Fonts上线；中国信通院发布大模型一体机应用报告；月之暗面推出Kimi Linear架构实现推理速度6倍提升；Canva免费发布Affinity设计套件挑战Adobe；Chrome新增Gemini驱动的图像生成与深度搜索功能。

Sora OpenAI 视频生成
Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发，专为多轮对话场景设计，支持中英川粤等多语言/方言与副语言风格，能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点，在播客、语音合成等场景表现突出，获开发者广泛关注。Hugging Face CEO也转发相关内容，团队未来将持续优化语音对话、拟人化表达等核心交互能力，深化开源生态建设。

SoulX-Podcast TTS 语音生成模型
易鑫正式发布汽车金融行业首个Agentic大模型

易鑫在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型参数量约300亿，响应延迟低于200毫秒，支持语音实时交互，单卡吞吐达370 tokens/秒，可提升获客、风控与运营效率，解决行业周期长、交互多、决策复杂等难题。易鑫作为AI驱动的金融科技平台，研发投入超20亿元，率先实现AI全场景应用，将持续推动智能汽车金融生态建设。

汽车金融大模型易鑫
荐AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑新工具“Smart Split”；Cursor 2.0发布

本期AI日报聚焦多项技术突破：MiniMax发布低延迟语音合成系统Speech 2.6，实现实时交互；蚂蚁数科与宁波银行打造的金融AI方案入选国际标准；智源推出具身操作能力的Emu3.5多模态模型；Cursor 2.0通过自研模型实现多智能体协同编程；xAI升级Grok新增视频生成功能；OpenAI推出可定制安全模型；TikTok推出AI剪辑工具Smart Split；微软发布强化学习框架Agent Lightning提升大模型训练效率。

AI日报 MiniMax Speech
脑机接口商业化资本涌动，Neuralink/微美全息强化系统规划谋发展全局

马斯克旗下Neuralink公司展示渐冻症患者通过脑机接口控制机械臂进食，这是其获批临床研究项目的重要进展。脑机接口技术正推动医疗设备从辅助工具升级为神经替代系统，吸引全球上万患者参与试验。该技术绕开传统神经肌肉交互路径，在思维与机器间建立直接通信，不仅应用于医疗康复，还延伸至教育、工业等领域。随着政策支持与技术融合，脑机接口产业加速壮大，预计2028年中国市场规模将达614亿元，未来十年有望迎来爆发式增长。

脑机接口 Neuralink 渐冻症
学生可享额外优惠！购三星Galaxy Z Flip7满足你在校园的多样需求

三星Galaxy Z Flip7双十一期间推出学生专属优惠，折叠设计搭配4.1英寸智能外屏，便于课间快速处理日程和消息。内置Galaxy AI功能，支持文件整理、实时翻译及演讲辅助，提升学习效率。影像系统配备5000万像素双摄和自由拍摄模式，轻松捕捉校园生活。提供珊瑚红等四款配色，学生认证可享额外400元优惠，活动期间还提供保价服务。

双十一购物三星Galaxy Z
“大模型应用”新风口：“无人测试”趋势，CIO/CTO如何应对

当前CIO面临的核心挑战是如何在有限IT预算下加速企业数字化转型。传统软件测试环节因人力密集、周期冗长成为效率瓶颈，而AI技术正推动测试模式从"辅助"向"无人化"演进。通过AI Agent实现全流程自主测试，可提升测试效率300%、降低成本30%，并将产品发布周期从"月"压缩至"周"。这不仅是技术升级，更是重构IT成本结构、实现降本增效的战略支点，助力IT部门从成本中心转型为价值创造中心。

IT预算规划数字化战略 AI大模型
Soul App开源播客语音合成模型SoulX-Podcast,支持流畅自然多轮语音对话

Soul App近日开源其播客语音合成模型SoulX-Podcast，专为多人多轮对话场景设计。该模型支持中、英、川、粤等多语言及方言，可生成超60分钟流畅自然、角色切换准确、韵律丰富的语音对话。除播客场景外，在通用语音合成及克隆任务中表现优异，能灵活调节节奏与副语言元素（如笑声），提升语音真实感与表现力。此次开源旨在携手开发者探索AI语音在内容创作与社交生态中的更多可能。

语音合成模型 SoulX-Podcast 多轮对话

今日大家都在搜的词：

热文

3 天
7天

续命Scaling Law？世界模型GPT-4o让智能体规划，OSU华人一作

触觉增强世界模型引关注，一目科技IROS首秀定义机器人感知新维度

荐AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear模型；MiniMax Music 2.0 发布

荐AI日报：Sora免费额度要缩水；月之暗面发布Kimi Linear架构；Canva免费放出Affinity专业设计套件

Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

易鑫正式发布汽车金融行业首个Agentic大模型

荐AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑新工具“Smart Split”；Cursor 2.0发布

脑机接口商业化资本涌动，Neuralink/微美全息强化系统规划谋发展全局

学生可享额外优惠！购三星Galaxy Z Flip7满足你在校园的多样需求

“大模型应用”新风口：“无人测试”趋势，CIO/CTO如何应对

Soul App开源播客语音合成模型SoulX-Podcast,支持流畅自然多轮语音对话

今日大家都在搜的词：

热文

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

OPPO Reno15系列官宣11月10日发布

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

特斯拉股东批准马斯克万亿美元薪酬包

曝折叠屏iPhone配2400万屏下摄像头预计2026年秋亮相

华为鸿蒙智行新款享界S9开启预订：预售价31.8万起

OPPO Find X9 Pro卫星通信版开启预售：6999元

何小鹏再回应机器人里藏真人质疑：现场展示内部结构

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

阿里回应饿了么更名：正处于灰度测试阶段

马斯克称若发现外星人证据就公开

AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

华为Mate70 Air官宣今日开启预售

vivo Y500 Pro官宣11月10日发布：同档首发2亿HP5主摄

站长商机