华为上线3D实景地图用户可在Petal出行体验

2022-11-04 16:23 · 稿源：站长之家

站长之家 11 月 4 日讯：在华为开发者大会上，余承东表示，华为全新上线了强大的3D实景地图，可以实现实景重建渲染，用户打开Petal出行就能体验。通过 2500 张照片，仅 30 分钟就能构建出 5 平方公里的超精细数字世界。3D实景地图还能实现室内实景的高精度还原。

（举报）

相关推荐
大家在看

关键词：

华为

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
MonoXiver:新AI算法将2D照片转换为3D地图

MonoXiver是北卡罗莱纳州立大学刘贤鹏团队开发的一种利用AI从二维图片中提取三维信息的方法。它只需要一个普通的单目摄像头，就可以构建相机周围可靠的三维地图。除自动驾驶外，这种AI方法也可应用于其他领域，如机器人、环境监测、医学成像等。

MonoXiver
CoDA开源：可在3D场景中检测和命名新物体

CoDA是一个端到端的开放词汇3D目标检测框架，旨在同时实现新对象的定位和分类。它主要包括两大特点:1.3D新对象发现策略:利用3D几何先验和2D语义先验联合发现场景中的新对象，生成新对象的伪标签。CoDA是一个非常创新的开放词汇3D目标检测框架，旨在解决这个领域的两个核心问题:新对象的定位和分类，具有非常高的学术价值和应用前景。

CoDA
Meta AI提出视频抠图新方法OmnimatteRF:结合动态2D前景图层和3D背景模型

Omnimatte是迄今为止最有前景的视频抠图方法。它使用单应性建模背景，因此只适用于背景为平面或仅有旋转运动的视频。它也可助力构建沉浸式的虚拟环境。

Meta
ChatGPT发福利了！付费用户可邀请朋友免费体验Plus功能

OpenAI近期宣布，无论是收费用户还是免费用户，都可以体验到联网模式，ChatGPT不再局限于2021年9月之前的数据，可以为用户提供最新的搜索信息。ChatGPT还加入了语音模型，语音沟通过程中的断句、语气等都与真人无异，甚至还会加上一些语气词，比如呃”等等，非常自然舒适，完全没有以往AI语音那种电子音”的属性。这些措施相信会为OpenAI的流量带来又一波高峰，如果你有ChatGPTPlus资格的话，不妨快去邀请朋友来体验。

ChatGPT 付费 OpenAI
SyncDreamer:从单视图图像生成多视图一致图像以实现3D重建

3D生成领域经历了迅猛的进展，其中一个备受瞩目、在GitHubRepo上广受欢迎的项目备受关注。这个项目被认为是最为稳定和通用的，用户只需提供一张图像，模型就能自动合成多个视图并生成相应的3D模型。SyncDreamer生成的图像可以用于高质量的3D重建。

SyncDreamer
Auctoria利用生成AI创建3D视频游戏模型

波兰虚拟现实游戏开发公司CarbonStudio的联合创始人AleksanderCaban多年前观察到现代游戏设计中存在一个重要问题:手动创建视频游戏环境中的基本元素，如岩石、山丘、路径等，通常是耗时且繁琐的过程。为了解决这个问题，Caban决定开发技术来自动化这个过程。我们的团队两年前开始开发这个工具，使我们能够拥有一个可供使用的产品。

Auctoria AI视频
好莱坞演员继续罢工抗议AI和3D扫描技术

好莱坞演员继续罢工，对抗AI技术的增长和使用，并声援“NOFAKESACT”法案。好莱坞编剧罢工已经结束，并获得了对剧本中的AI保护措施，但对于演员来说，情况却并不乐观。包括MoveAI在内的初创公司正在开发可以使用单部智能手机的AI驱动的3D运动捕捉技术，这将大大降低成本和所需资源。
淘宝回应上线微信支付：部分用户可用正逐步开放

有网友反馈称在自己的淘宝App支付页面出现了“微信扫码支付”选项，这一变化引起了广泛关注和讨论。根据微博博主“读秒财经”向淘宝客服询问得到的回应，微信扫码支付功能正在逐步开放，但目前仅针对部分用户开放只有部分商品支持这一支付方式。目前在淘宝使用微信支付必须通过二维码，需要用户先保存支付二维码，再用微信扫码付款，操作相对较为复杂。
即刻上线“友友地图”APP：桌面小组件随时看好友在哪儿

提到即刻”APP很多人不会陌生，它是一款基于兴趣的信息推送提醒工具，用户关注自己感兴趣的人物、资讯和事件，它会跟踪并推送相应的动态。即刻”发布了一款名为友友地图”的社交APP，让你在桌面小组件上就能直接看到好友的地理位置，以及ta的最新照片。友友地图”的玩法也很简单:1、添加至少一个好友2、你的好友发新照片了，在桌面上立刻就可以看到!3、戳小组件上的按钮来看朋友们在哪儿可以催大家更新照片!类似的密友社交”是近年来比较受关注的社交细分赛道，桌面组件照片分享已经成了主流展示方式之一。
报道称Midjourney存在漏洞用户可绕过生成违规图片

据itbusiness报道，近期，一项新的研究揭示了Midjourney图片生成器存在的严重安全漏洞，这可能引发一场新的争议。MidjourneyMI作为一款生成式人工智能平台，在其服务条款中明确禁止用户制作任何侮辱性或攻击性的图片。过去几个月，人工智能技术被广泛用于政治宣传，但同时也引发了关于虚假信息和误导性图片的忧虑。

Midjourney 漏洞 AI头条

RAGFlow:开源的基于深度文档理解的RAG（检索增强生成）引擎

RAGFlow是一个开源的RAG（Retrieval-Augmented Generation）引擎，基于深度文档理解，提供流线型的RAG工作流程，适用于各种规模的企业。它结合了大型语言模型（LLM）提供真实的问答能力，支持从各种复杂格式数据中引用确凿的引文。

自然语言处理机器学习信息检索

EmojiTell:使用表情组合翻译器，让沟通更有趣且富有表现力。

EmojiTell是一个创新的在线服务，可以将文本翻译成表情组合，增加沟通的趣味性和表现力。它由一支对表情符号充满热情的开发者和设计师团队开发，旨在通过表情符号的力量，让信息传递更加生动和个性化。

表情符号翻译沟通

Perplexica:一个开源的AI驱动搜索引擎，提供深入网络的答案。

Perplexica是一个开源的AI驱动搜索引擎，它不仅搜索网络，还理解您的问题。它使用先进的机器学习算法，如相似性搜索和嵌入，来优化结果，并提供引用来源的清晰答案。使用SearxNG保持最新和完全开源，确保您始终获得最新信息，同时不损害您的隐私。

搜索引擎机器学习人工智能

FaceChain:深度学习工具链，用于生成你的数字孪生体。

FaceChain是一个深度学习工具链，由ModelScope提供支持，能够通过至少1张肖像照片生成你的数字孪生体，并在不同设置中生成个人肖像（支持多种风格）。用户可以通过FaceChain的Python脚本、熟悉的Gradio界面或sd webui来训练数字孪生模型并生成照片。FaceChain的主要优点包括其生成个性化肖像的能力，支持多种风格，以及易于使用的界面。

深度学习数字孪生个性化

Huggingface 镜像站:一个公益项目，致力于帮助国内AI开发者快速、稳定的下载模型、数据集。

HuggingFace镜像站是一个非盈利性项目，旨在为国内的AI开发者提供一个快速且稳定的模型和数据集下载平台。通过优化下载过程，减少因网络问题导致的中断，它极大地提高了开发者的工作效率。该镜像站支持多种下载方式，包括网页直接下载、使用官方命令行工具huggingface-cli、本站开发的hfd下载工具以及通过设置环境变量来实现非侵入式下载。

AI 机器学习数据集

WebLlama:构建能够根据指令浏览网页并和您对话的强大代理

WebLlama是一个基于Meta Llama 3构建的代理，专门为网页导航和对话进行了微调。它旨在构建有效的以人为中心的代理，帮助用户浏览网页，而不是取代用户。该模型在WebLINX基准测试中超越了GPT-4V（零样本）18%，展示了其在网页导航任务中的卓越性能。

网页导航对话代理机器学习

Infra Copilot:利用机器学习自动生成基础设施代码，提高开发效率。

GitHub Copilot for Infrastructure as Code（简称Infra Copilot）是一个利用机器学习技术帮助基础设施专业人员自动生成精确基础设施代码的工具。它通过理解基础设施任务的上下文，允许专业人员使用自然语言表达需求，并接收相应的代码建议。Infra Copilot不仅简化了基础设施即代码（IaC）的开发过程，还确保了跨环境和项目的一致性，加速了新团队成员的上手和学习过程，显著提高了工作效率并节约了时间。

基础设施即代码自动化机器学习

LLaVA++:扩展LLaVA模型，集成Phi-3和LLaMA-3，提升视觉与语言模型的交互能力。

LLaVA++是一个开源项目，旨在通过集成Phi-3和LLaMA-3模型来扩展LLaVA模型的视觉能力。该项目由Mohamed bin Zayed University of AI (MBZUAI)的研究人员开发，通过结合最新的大型语言模型，增强了模型在遵循指令和学术任务导向数据集上的表现。

人工智能自然语言处理机器学习

PhysDreamer:通过视频生成实现基于物理的3D对象交互

PhysDreamer是一个基于物理的方法，它通过利用视频生成模型学习到的对象动力学先验，为静态3D对象赋予交互式动力学。这种方法允许在缺乏真实物体物理属性数据的情况下，模拟出对新颖交互（如外力或代理操作）的真实反应。PhysDreamer通过用户研究评估合成交互的真实性，推动了更吸引人和真实的虚拟体验的发展。

3D交互视频生成物理模拟

AI快站:专注于提供HuggingFace模型免费加速下载服务的平台

AI快站是一个为AI开发者设计的服务平台，提供HuggingFace模型的免费加速下载，解决大模型下载缓慢和断开的问题，支持高达4M/s的下载速度，大幅减少等待时间，提高开发效率。

HuggingFace模型加速下载断点续传

Llama-3 8B Instruct 262k:一款由Gradient AI团队开发的高性能文本生成模型。

Llama-3 8B Instruct 262k是一款由Gradient AI团队开发的文本生成模型，它扩展了LLama-3 8B的上下文长度至超过160K，展示了SOTA（State of the Art）大型语言模型在学习长文本操作时的潜力。该模型通过适当的调整RoPE theta参数，并结合NTK-aware插值和数据驱动的优化技术，实现了在长文本上的高效学习。此外，它还基于EasyContext Blockwise RingAttention库构建，以支持在高性能硬件上的可扩展和高效训练。

华为上线3D实景地图 用户可在Petal出行体验

今日大家都在搜的词：

热文

站长商机

华为上线3D实景地图用户可在Petal出行体验