懂3D的语言模型来了！UCLA、上交、MIT等联合提出3D-LLM：性能大涨9%

2023-08-03 15:39 · 稿源：新智元公众号

【新智元导读】有了3D-语言模型，去重庆导航也不在「话」下!大型语言模型（LLM）和视觉语言模型(VLM)在各种评测基准中都展现出了强大的性能，比如可以看图说话、进行常识推理。但这些模型的训练过程并没有引入3D物理世界，也就无法理解更丰富的现实概念，包括空间关系、布局、物体

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

（举报）

相关推荐

关键词：

京东11.11直播技术全面升级，立影3D技术、JoyAI大模型重构沉浸式购物体验

京东在双11期间升级直播技术，推出“立体3D技术”和“JoyAI大模型”等创新。立体3D技术实现裸眼360度商品展示，用户无需额外设备即可旋转查看产品细节；JoyAI生成虚拟偶像Aura，与真人明星跨次元互动，提升趣味性。AI工具还简化直播运营，支持智能脚本和选品。这些技术打破传统直播边界，增强沉浸感和互动效率，引领电商直播创新方向。

京东11.11 立影3D技术 JoyAI大模型
荐AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear模型；MiniMax Music 2.0 发布

本期AI日报聚焦多领域创新：昆仑万维推出SkyReels V3模型，整合顶尖视频生成能力；月之暗面Kimi Linear模型处理长文本速度提升2.9倍；MiniMax Music 2.0实现专业级音乐创作；字节跳动启动豆包股权激励计划吸引AI人才；苹果iOS 27将迎AI重大升级，Siri更个性化；Dia浏览器融合Arc设计理念与AI技术；文心魔法漫画工具实现一键生成连载作品；谷歌Gemini Canvas新增PPT自动生成功能，由Gemini 2.5 Pro驱动，提升职场效率。

AI视频生成 SkyReels V3
覆盖43国语言与93种口音：时空壶新T1成为国庆环球游的沟通核心

国庆假期海外游热度攀升，语言差异成为旅行体验的关键挑战。时空壶新T1翻译机以广泛语言覆盖、精准语音识别和场景化设计应对多元沟通需求：支持40种语言及93种口音互译，覆盖全球热门旅游地；针对非标准口音优化识别系统，在嘈杂环境中仍能准确拾音；配备4英寸大屏与快捷操作键，实现0.2秒低延迟翻译。其硬件设计与算法协同提升沟通效率，让点餐、问路等即时交流需求得到高效满足，真正实现“沟通不等待”的旅行体验。

旅游热度语言差异口音多样性
易鑫正式发布汽车金融行业首个Agentic大模型

易鑫在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型参数量约300亿，响应延迟低于200毫秒，支持语音实时交互，单卡吞吐达370 tokens/秒，可提升获客、风控与运营效率，解决行业周期长、交互多、决策复杂等难题。易鑫作为AI驱动的金融科技平台，研发投入超20亿元，率先实现AI全场景应用，将持续推动智能汽车金融生态建设。

汽车金融大模型易鑫
登榜LMArena！文心大模型5.0-Preview文本能力国内第一

11月8日，文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出，超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容；复杂长问题理解适用于学术问答、报告分析等任务；指令遵循能力支持智能助理、代码生成等场景，为多领域内容生产提供高效支撑。

文心模型 ERNIE-5.0 创意写作
每天刷手机青少年认知能力显著下降：高频互动或致语言记忆下滑

加州大学研究团队在《美国医学会杂志》发表研究，追踪6500名9至13岁青少年社交媒体使用行为。研究发现，社交媒体使用时长增加与认知能力下降存在显著关联，尤其影响语言流畅度、工作记忆等核心功能。研究指出，社交媒体高频互动特性会切割注意力，干扰大脑深度信息处理能力。专家建议家长关注使用模式而非单纯限制时间，结合个体认知特点制定干预策略，引导青少年建立健康媒介使用习惯。

社交媒体认知能力青少年研究
机器人“全能导航大脑”来了！银河通用发布NavFoM大模型

银河通用发布全球首个跨本体全域环视导航基座大模型NavFoM，实现机器人从“学会完成导航任务”到“真正理解移动”的跨越。该模型支持全场景、多任务、跨本体应用，通过统一“视频流+文本指令→动作轨迹”范式，融合800万条跨任务导航数据，在真实机器人上实现零样本自主避障、路径规划等复杂任务。其技术突破将推动具身智能从单一功能进化为基础设施，为规模化商业落地奠定关键基础。

机器狗导航大模型 TrackVLA
千元卧室投影推荐：实测大眼橙C3D画质/性能/体验都能打

大眼橙C3D投影仪专为卧室场景设计，小巧机身节省空间，支持自动对焦和梯形校正，操作便捷。配备一体化云台，可360°旋转调节角度，轻松适配不同观影姿势。画质表现优秀，1080P分辨率兼容4K解码，850CVIA亮度确保开灯环境下画面清晰，MEMC运动补偿避免拖影。内置低噪音设计和卧室模式，兼顾安静与舒适观影体验，结合腾讯视频AI语音助手，实现智能操控。整体精准契合卧室娱乐需求，提升幸福感。

双11购物清单提升卧室幸福感卧室投影仪
何小鹏首次披露物理AI巨大进展发布第二代VLA大模型

小鹏汽车在2025科技日发布第二代VLA大模型，颠覆传统“视觉-语言-动作”架构，实现端到端直接输出动作指令，开创物理模型新范式。该模型具备动作生成与物理世界理解能力，参数规模达数十亿级，训练数据近1亿clips。基于2250TOPS算力的Ultra车型成功搭载，推动智驾技术显著进化，同步发布“小径NGP”功能，复杂小路接管里程提升13倍。行业首发的无导航辅助驾驶Super+LCC实现全球覆盖。何小鹏表示，大模型将成为物理AI世界的操作系统，并宣布与大众汽车达成战略合作，共同推进智能出行发展。

小鹏汽车 VLA大模型智能出行
免费 GEO品牌可见度查询——让大模型信得过就这么玩

本文探讨在AI时代如何成为大模型信赖的信息源。关键点包括：可信信息源需具备数据来源清晰、内容结构化、可验证追踪等能力；提出五大实操要点——确保数据干净可追溯、采用RAG等技术增强可检索性、保持内容更新与时效性、强化品牌可见度、建立反馈优化机制。同时推荐使用AIBase平台的GEO排名查询工具免费监测内容可见度，通过持续优化提升在大模型入口的推荐概率。

文章搜索核心标签可信信息源

今日大家都在搜的词：

热文

3 天
7天

懂3D的语言模型来了！UCLA、上交、MIT等联合提出3D-LLM：性能大涨9%

京东11.11直播技术全面升级，立影3D技术、JoyAI大模型重构沉浸式购物体验

荐AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear模型；MiniMax Music 2.0 发布

覆盖43国语言与93种口音：时空壶新T1成为国庆环球游的沟通核心

易鑫正式发布汽车金融行业首个Agentic大模型

登榜LMArena！文心大模型5.0-Preview文本能力国内第一

每天刷手机青少年认知能力显著下降：高频互动或致语言记忆下滑

机器人“全能导航大脑”来了！银河通用发布NavFoM大模型

千元卧室投影推荐：实测大眼橙C3D画质/性能/体验都能打

何小鹏首次披露物理AI巨大进展发布第二代VLA大模型

免费 GEO品牌可见度查询——让大模型信得过就这么玩

今日大家都在搜的词：

热文

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

华为Mate70 Air官宣今日开启预售

AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏

OPPO Reno15系列官宣11月10日发布

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

何小鹏回应机器人IRON里是真人质疑：感谢认可

站长商机