首页 > 业界 > 关键词  > 3D-语言模型最新资讯  > 正文

懂3D的语言模型来了!UCLA、上交、MIT等联合提出3D-LLM:性能大涨9%

2023-08-03 15:39 · 稿源: 新智元公众号

【新智元导读】有了3D-语言模型,去重庆导航也不在「话」下!大型语言模型(LLM)和视觉语言模型(VLM)在各种评测基准中都展现出了强大的性能,比如可以看图说话、进行常识推理。但这些模型的训练过程并没有引入3D物理世界,也就无法理解更丰富的现实概念,包括空间关系、布局、物体

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 京东11.11直播技术全面升级,立影3D技术、JoyAI大模型重构沉浸式购物体验

    京东在双11期间升级直播技术,推出“立体3D技术”和“JoyAI大模型”等创新。立体3D技术实现裸眼360度商品展示,用户无需额外设备即可旋转查看产品细节;JoyAI生成虚拟偶像Aura,与真人明星跨次元互动,提升趣味性。AI工具还简化直播运营,支持智能脚本和选品。这些技术打破传统直播边界,增强沉浸感和互动效率,引领电商直播创新方向。

  • AI日报:昆仑万维SkyReels V3模型上线;月之暗面推Kimi Linear模型;MiniMax Music 2.0 发布

    本期AI日报聚焦多领域创新:昆仑万维推出SkyReels V3模型,整合顶尖视频生成能力;月之暗面Kimi Linear模型处理长文本速度提升2.9倍;MiniMax Music 2.0实现专业级音乐创作;字节跳动启动豆包股权激励计划吸引AI人才;苹果iOS 27将迎AI重大升级,Siri更个性化;Dia浏览器融合Arc设计理念与AI技术;文心魔法漫画工具实现一键生成连载作品;谷歌Gemini Canvas新增PPT自动生成功能,由Gemini 2.5 Pro驱动,提升职场效率。

  • 覆盖43国语言与93种口音:时空壶新T1成为国庆环球游的沟通核心

    国庆假期海外游热度攀升,语言差异成为旅行体验的关键挑战。时空壶新T1翻译机以广泛语言覆盖、精准语音识别和场景化设计应对多元沟通需求:支持40种语言及93种口音互译,覆盖全球热门旅游地;针对非标准口音优化识别系统,在嘈杂环境中仍能准确拾音;配备4英寸大屏与快捷操作键,实现0.2秒低延迟翻译。其硬件设计与算法协同提升沟通效率,让点餐、问路等即时交流需求得到高效满足,真正实现“沟通不等待”的旅行体验。

  • 易鑫正式发布汽车金融行业首个Agentic大模型

    易鑫在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型参数量约300亿,响应延迟低于200毫秒,支持语音实时交互,单卡吞吐达370 tokens/秒,可提升获客、风控与运营效率,解决行业周期长、交互多、决策复杂等难题。易鑫作为AI驱动的金融科技平台,研发投入超20亿元,率先实现AI全场景应用,将持续推动智能汽车金融生态建设。

  • 登榜LMArena!文心大模型5.0-Preview文本能力国内第一

    11月8日,文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出,超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容;复杂长问题理解适用于学术问答、报告分析等任务;指令遵循能力支持智能助理、代码生成等场景,为多领域内容生产提供高效支撑。

  • 每天刷手机 青少年认知能力显著下降:高频互动或致语言记忆下滑

    加州大学研究团队在《美国医学会杂志》发表研究,追踪6500名9至13岁青少年社交媒体使用行为。研究发现,社交媒体使用时长增加与认知能力下降存在显著关联,尤其影响语言流畅度、工作记忆等核心功能。研究指出,社交媒体高频互动特性会切割注意力,干扰大脑深度信息处理能力。专家建议家长关注使用模式而非单纯限制时间,结合个体认知特点制定干预策略,引导青少年建立健康媒介使用习惯。

  • 机器人“全能导航大脑”来了!银河通用发布NavFoM大模型

    银河通用发布全球首个跨本体全域环视导航基座大模型NavFoM,实现机器人从“学会完成导航任务”到“真正理解移动”的跨越。该模型支持全场景、多任务、跨本体应用,通过统一“视频流+文本指令→动作轨迹”范式,融合800万条跨任务导航数据,在真实机器人上实现零样本自主避障、路径规划等复杂任务。其技术突破将推动具身智能从单一功能进化为基础设施,为规模化商业落地奠定关键基础。

  • 千元卧室投影推荐:实测大眼橙C3D画质/性能/体验都能打

    大眼橙C3D投影仪专为卧室场景设计,小巧机身节省空间,支持自动对焦和梯形校正,操作便捷。配备一体化云台,可360°旋转调节角度,轻松适配不同观影姿势。画质表现优秀,1080P分辨率兼容4K解码,850CVIA亮度确保开灯环境下画面清晰,MEMC运动补偿避免拖影。内置低噪音设计和卧室模式,兼顾安静与舒适观影体验,结合腾讯视频AI语音助手,实现智能操控。整体精准契合卧室娱乐需求,提升幸福感。

  • 何小鹏首次披露物理AI巨大进展 发布第二代VLA大模型

    小鹏汽车在2025科技日发布第二代VLA大模型,颠覆传统“视觉-语言-动作”架构,实现端到端直接输出动作指令,开创物理模型新范式。该模型具备动作生成与物理世界理解能力,参数规模达数十亿级,训练数据近1亿clips。基于2250TOPS算力的Ultra车型成功搭载,推动智驾技术显著进化,同步发布“小径NGP”功能,复杂小路接管里程提升13倍。行业首发的无导航辅助驾驶Super+LCC实现全球覆盖。何小鹏表示,大模型将成为物理AI世界的操作系统,并宣布与大众汽车达成战略合作,共同推进智能出行发展。

  • 免费 GEO品牌可见度查询——让大模型信得过就这么玩

    本文探讨在AI时代如何成为大模型信赖的信息源。关键点包括:可信信息源需具备数据来源清晰、内容结构化、可验证追踪等能力;提出五大实操要点——确保数据干净可追溯、采用RAG等技术增强可检索性、保持内容更新与时效性、强化品牌可见度、建立反馈优化机制。同时推荐使用AIBase平台的GEO排名查询工具免费监测内容可见度,通过持续优化提升在大模型入口的推荐概率。

今日大家都在搜的词: