首页 > 业界 > 关键词  > 3D-语言模型最新资讯  > 正文

懂3D的语言模型来了!UCLA、上交、MIT等联合提出3D-LLM:性能大涨9%

2023-08-03 15:39 · 稿源: 新智元公众号

【新智元导读】有了3D-语言模型,去重庆导航也不在「话」下!大型语言模型(LLM)和视觉语言模型(VLM)在各种评测基准中都展现出了强大的性能,比如可以看图说话、进行常识推理。但这些模型的训练过程并没有引入3D物理世界,也就无法理解更丰富的现实概念,包括空间关系、布局、物体

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • Evisort成功开发法律同领域的大型语言模型(LLM)

    Evisort成功开发了专门用于法律协议的大型语言模型,并将其作为其新的多方位生成AI引擎的关键组成部分。该LLM将使Evisort能够提供比通用的第三方LLMs更准确和响应更灵活的AI创新,从帮助组织更好地管理合同。这一创新也受到了业界的认可,得到了微软风投M12的高度评价。

  • 开源机器学习库vLLM 提升大语言模型推理速度

    大语言模型在改变人们的生活和职业方面影响越来越大,因为它们实现了编程助手和通用聊天机器人等新应用。这些应用的运行需要大量硬件加速器如GPU,操作成本非常高。更大的模型、更复杂的解码算法和更长的序列会导致更明显的改进。

  • OpenAI科学家最新大语言模型演讲火了,洞见LLM成功的关键

    OpenAI研究科学家HyungWonChung在首尔国立大学做了题为「LargeLanguageModels」的演讲。他在自己的YouTube频道上写到:「这是一次雄心勃勃的尝试,旨在总结我们这个爆炸性的领域。至于哪个AI模型将成为这个新范式的旗舰代表,就让我们拭目以待吧。

  • Meta AI提出视频抠图新方法OmnimatteRF:结动态2D前景图层和3D背景模型

    Omnimatte是迄今为止最有前景的视频抠图方法。它使用单应性建模背景,因此只适用于背景为平面或仅有旋转运动的视频。它也可助力构建沉浸式的虚拟环境。

  • Auctoria利用生成AI创建3D视频游戏模型

    波兰虚拟现实游戏开发公司CarbonStudio的联合创始人AleksanderCaban多年前观察到现代游戏设计中存在一个重要问题:手动创建视频游戏环境中的基本元素,如岩石、山丘、路径等,通常是耗时且繁琐的过程。为了解决这个问题,Caban决定开发技术来自动化这个过程。我们的团队两年前开始开发这个工具,使我们能够拥有一个可供使用的产品。

  • 生成式AI—大语言模型是如何生成内容的?

    备受关注的大语言模型,核心是自然语言的理解与文本内容的生成,对于此,你是否好奇过它们究竟是如何理解自然语言并生成内容的,其工作原理又是什么呢?要想了解这个,我们就不得不先跳出大语言模型的领域,来到机器翻译这里。传统的机器翻译方式是采用RNN循环神经网络。以上就是大语言模型的工作原理了,强大Transformer的实用性还不止于在自然语言处理领域,包括�

  • 创新型生成模型CityDreamer:一键生成无边界的3D城市

    关于3D自然场景生成的研究已经很多,但对于3D城市生成的研究相对较少。这是因为在城市环境中,人们对结构扭曲更加敏感生成3D城市比生成3D自然场景更为复杂。这一技术的应用前景非常广阔,将在游戏、城市规划、虚拟现实等领域发挥关键作用。

  • 寒武纪提升产品在AIGC及大语言模型领域的性能并推动技术

    目前,人工智能芯片技术仍处于发展的初期阶段,技术迭代速度加快,技术发展路径尚在探索中,尚未形成具有绝 对优势的架构和系统生态。随着越来越多的厂商推出人工智能芯片产品,该领域市场竞争日趋激烈。寒武纪自成立以来一直专注于人工智能芯片设计领域,积累了较强的技术和研发优势,已获得一批核心技术与关键专利,技术创新能力得到业界广泛认可,并较早实�

  • LayoutNUWA:一个基于大型语言模型的布局生成工具

    在网上创建引人注目的设计对于吸引用户的兴趣和帮助他们理解信息非常重要。这种新方法,被称为LayoutNUWA,通过使用语言模型将编码指令转化为出色的布局,使这些设计更加智能。通过这些核心功能,LayoutNUWA为用户提供了一个强大的布局生成工具,可以应用于各种项目和领域,从提高布局生成的效率和质量。

  • 法国初创公司 Mistral AI 免费发布高性能语言模型 Mistral7B

    MistralAI,一家法国人工智能初创公司,最近发布了一款性能优越的语言模型Mistral7B,并免费向所有人提供使用。图片来源:米斯特拉尔人工智能该模型基于Apache2.0许可证发布,除了归属之外,没有任何使用或复制的限制。对于对Mistral7B模型的开放性以及未来发布计划的一些疑问,我们已经联系了Mistral,并等待他们的回复。