首页 > 业界 > 关键词  > 全息最新资讯  > 正文

全息角色传送技术突破:仅需4个摄像头实现逼真4K自由视角视频

2024-05-08 09:27 · 稿源:站长之家

站长之家(ChinaZ.com)5月8日 消息:马克斯·普朗克信息学研究所、萨尔大学和萨尔布吕肯视觉计算、交互与人工智能研究中心的合作团队提出了一种创新的实时渲染方法,该方法只需要4个摄像头视角和3D骨骼姿势,就能够捕捉并呈现人类运动的高度逼真细节,包括衣服的褶皱、面部表情和手势。这一技术能够实时以4K分辨率生成角色的自由视角视频,为动画制作、影视特效以及游戏开发带来了革命性的变革。

image.png

项目地址:https://vcai.mpi-inf.mpg.de/projects/holochar/

主要功能亮点

  • 实时自由视角呈现:通过4个稀疏摄像头视角和3D骨骼姿势数据,实现在4K分辨率下实时生成角色视频。

  • 高精度动态建模:采用骨骼驱动的神经网络,精确捕捉人体的动态几何形状,细致呈现衣物、面部及手势等细节。

  • 依视角变化的纹理映射:从四个摄像头视角创建变化的纹理,准确重现角色动态中的纹理细节。

  • 图像优化与4K渲染:使用图像优化网络生成高分辨率视频画面,确保最终视频的逼真度和细腻度。

  • 广泛适用的角色表现:适应不同类型演员的服装,无论是紧身或宽松,都能捕捉并呈现丰富的动态细节。

技术方法

  • 骨骼模型驱动:利用人的骨骼姿势数据创建虚拟模型,跟踪人体运动。

  • 多角度纹理映射:将不同角度摄像头捕捉的图像映射到虚拟模型上,生成逼真的外观。

  • 纹理增强:通过神经网络结合多角度图像数据,增强衣物褶皱和面部表情等细节。

  • 图像优化:最终渲染成4K超高分辨率画面,确保角色细节在各种动作和服装下的真实呈现。

这项技术的应用前景广阔,不仅能够提升影视和游戏内容的制作质量,还能够为虚拟现实(VR)和增强现实(AR)体验提供更加逼真的视觉效果。

举报

  • 相关推荐
  • 英伟达正研发新型AI芯片,微美全息(WIMI.US)携算力方案加入全球科技争霸赛

    马斯克终止Dojo超级计算机项目,耗资超十亿美元后转向斥资数十亿购买英伟达AI芯片。特斯拉计划到2025年底将H100芯片数量从3.5万增至8.5万块。英伟达凭借强大训练芯片性能占据市场主导,并正为中国市场开发基于Blackwell架构的新型AI芯片B30A和RTX6000D。全球AI推理芯片市场正经历爆发式增长,预计2023至2030年复合增长率超35%。微美全息等科技公司加大AI算力投入,推动边缘计算与A

  • 2030万物智联6G商用在望,微美全息(WIMI.US)以AI赋能6G“领先之路”

    国际电信联盟无线通信局卫星研究组在上海会议达成两项关键成果:确定3GPP非地面网络技术为5G卫星唯一国际方案,统一5G地面与卫星技术体系;明确6G卫星技术研究时间表,与地面6G同步推进。这标志着移动通信进入“天地融合”时代,中国技术主导地位凸显。6G预计2030年前后商用,将实现地面网络、卫星与低空平台深度融合,构建全域无缝覆盖网络。微美全息等企业已提前布局6G研发,推动技术攻关和生态建设。

  • 微云全息(NASDAQ:HOLO)打造区块链创新型金融协同设计方案,引领行业变革

    金融行业协同工作面临效率与安全挑战。微云全息开发的金融智链协同方案融合区块链技术,通过智能合约、分布式账本和先进加密技术,实现数据安全、透明同步与自动化处理。该方案提升协同效率,保障数据完整性,支持跨机构无缝协作,有望推动金融行业建立更高效、安全的协同标准,促进金融科技发展。

  • 普渡机器人发布3D感知AI扫地机器人PUDU MT1 Max,重塑智能清洁新高度

    普渡机器人于2025年8月20日发布3D感知AI扫地机器人PUDU MT1Max。该产品在MT1基础上大幅升级,搭载3D雷达与多传感器融合系统,显著增强复杂场景感知与避障能力。通过AI技术实现自适应清洁、垃圾识别、巡检清洁等功能,支持10万平方米以上大场景作业。具备自动振尘过滤和智能避雨机制,提升安全性与运维效率,重塑智能清洁行业新标准。

  • AI日报:Wan 2.2-S2V模型即将发布;​字节跳动内测3D Model Generator;微软开源 VibeVoice-1.5B 模型

    本期AI日报聚焦多项技术突破:阿里通义万相发布Wan 2.2-S2V模型,实现视频音频同步生成;字节跳动研发3D模型生成工具,降低建模门槛;面壁智能推出MiniCPM-V4.5端侧多模态模型;苹果提出RLCF训练法提升模型性能;微软开源VibeVoice-1.5B支持超长语音合成;谷歌Imagen 4正式上线;英伟达发布Jetson Thor机器人计算平台;Genspark推出AI Designer一键生成品牌方案;豆包上线未成年人保护模式。

  • 视源股份全栈自研机器人首次亮相世界机器人大会 定位“3D岗”生产力伙伴

    2025世界机器人大会在北京开幕,视源股份携自主研发的机器人产品参展。其工业级高性能四足机器人MAXHUB X7首次亮相,具备全天候、全地形作业能力,已在工业、电力等场景落地应用。该产品采用多传感器融合导航技术,能适应复杂环境,IP66防护等级确保极端条件下稳定运行。视源股份依托"三院一站"研发体系,构建了从算法创新到制造验证的机器人全栈技术能力。目前公司商用清洁机器人已进入欧洲、东南亚及日本市场,在大型商超批量部署。未来将持续加大研发投入,推动机器人与行业场景深度融合。

  • 量子机器学习或“搅动”芯片制造,谷歌/微美全息攻关突破取得阶段性成果

    澳大利亚科研团队开发出结合人工智能和量子计算原理的新型量子机器学习技术,可能改变微芯片制造方式。该技术仅需5个量子比特,性能优于7种经典机器学习算法,可立即应用于现有量子架构。2023年量子计算领域取得多项突破:微软成功创建拓扑量子比特,D-Wave量子退火处理器性能超越经典模拟器,谷歌量子AI团队探讨扩展超导量子计算机面临的挑战。量子科技正从理论研究迈向工程实现阶段,微美全息(WIMI.US)等企业积极推进量子密码生成器、QGAN技术等研发,有望为数据安全提供更高保障。量子技术发展已进入关键时期,将推动行业进入更安全可靠的发展阶段。

  • 三星年底推出XR新品头显,字节跳动/微美全息加速MR眼镜布局卡位争夺先机

    三星确认将于2023年下半年推出三折折叠智能手机与XR头显组合设备,搭载Android XR系统,配备Micro OLED/OLEDoS显示屏,支持90Hz刷新率和眼动追踪功能。字节跳动旗下PICO公司正开发代号"Project P"的MR头显,直接对标Meta计划2027年推出的旗舰产品"Phoenix"。微美全息(WIMI.US)作为AR领域重要参与者,通过技术研发和生态合作持续强化竞争力。行业分析指出,XR设备正朝着轻量化方向发展,分体式设计可能成为未来主流趋势,市场竞争格局正在重塑。

  • 苹果首秀脑机技术解锁意念操控,微美全息(WIMI.US)追赶推动脑机接口驶入快车道

    苹果首次将脑机接口技术纳入操作系统原生输入方式,与Synchron公司合作开发Stentrode设备,通过植入大脑血管的微型金属支架捕捉神经信号。iOS26/iPadOS26系统将支持脑控功能,标志着该技术从医疗领域向消费电子拓展。全球脑机接口市场规模预计从2024年26.2亿美元增长至2034年124亿美元,年复合增长率17.35%。中国市场规模达28亿元,占全球15%。微美全息(WIMI.US)等企业正加大研发投入,布局脑电信号处理算法等核心技术。该技术融合神经科学、AI、材料学等多学科成果,未来将推动人机交互革命,从实验室加速走向商业化应用。

  • 具身智能机器人产业投资热度攀升,阿里/京东/微美全息齐上阵探寻长期发展潜力

    2025年人形机器人行业迎来融资热潮,京东、腾讯、阿里等科技巨头纷纷入局。摩根士丹利预测2050年全球市场规模将超5万亿美元。国内政策大力支持,核心部件国产化率超70%,今年产业规模有望达379亿元。微美全息(WIMI.US)等企业加速技术突破,布局关键组件研发。行业正从实验室走向生产线,在养老等场景实现应用落地。未来3-5年有望实现商业化突破,逐步融入生产生活各领域。

今日大家都在搜的词: