旷视科技：聊聊旷厂黑科技-全景视频实时拼接，看见“视界之外”

2024-08-16 11:42 · 稿源：站长之家用户

120度，是人类双眼视野的大致范围。

为了用更宽阔的视野观察、记录这个世界，人们开始使用工具，希望将整个世界都纳入画面中。为此，能同时拍摄整个空间画面的全景相机出现了。

早期的全景相机需要固定在一个旋转云台上，拍摄前拧紧发条，然后旋转相机进行拍摄。不仅手段繁琐，而且由于旋转速度较慢，拍摄画面中的人物需要长时间保持固定姿势。

进入数码相机时代，照片的获得与后期处理变得更加便捷，厂商们各显神通，全景相机的类型和功能也日益丰富。2006年，瑞士赛兹公司发布了一台6x17Digital相机，这个“大家伙”外形尺寸为495x175x95cm，感光器有6x17cm、比较高分辨率达7500x21250px、获得的相片总像素接近1.6亿，并且，仅机身的价格就高达几十万人民币。

为了打破全景相机庞大笨重、售价不菲的特质，厂商开始寻求其他的解决方法，“扫描全景模式”就是其中之一。比如索尼HX1，相机在全景拍摄模式下，会在按下快门时快速连续扫描被摄物体，并在机内自动寻找相同色块自动拼接。该方式面对静止的物体时能以非常简单的方式获得全景拍摄效果，可是却不能准确判断画面中移动的物体，容易形成重影。

与此同时，随着人们观察与记录世界的视角越来越多元化，视频也成为记录日常的主要方式之一，能够容纳更多信息、视觉冲击力更大的全景视频更是深受人们的喜爱，逐渐成为了主流发展方向。然而相对于静态的全景照片而言，动态的全景视频的实现对技术有着更高的要求，硬件升级成本居高不下。

因此，以AI算法弥补硬件升级的不足，打造全景视频拼接技术成为了新探索方向。

拼接技术“曲线救国”，全景视频痛点依旧

所谓全景视频拼接技术，即多个摄像头在同一场景下采集不同方向的视频，后期逐帧拼接，最终得到360度全景视频，甚至360度*180度的球面全景视频。

但是，目前行业里的全景视频拼接技术仍存在一些尚未解决的问题。

首先是多摄拼接计算量大。传统的拼接算法需要提取图像中的特征点、描述子进行匹配，之后反复迭代得到特出的对齐关系，但在相机标定对齐的过程中会产生大量的计算。

其次是视频拼接存在明显拼缝。即使是在计算量非常大的情况下，也需要对于相机之间的关系进行一定的假设，如共光心模型无法适用于大视角，目前即使是网格法求出多组匹配关系也无法应对由于大视角导致的物体拉伸扭曲变形。目前的算法增加了对于扭曲的约束，但不能从根本上解决问题。

另外，还存在拼接无法动态更新。视频拼接技术中存在一个普遍的问题，那就是运动物体在重合区域会产生虚影，就像将手指放在两眼之间前后移动时会出现虚影一样。要解决这个问题，需要随时将相机的光心聚焦到目标点，不断变换拼接模板;同时，为了使拼接的视频流畅，还需要考虑到单帧间信息。这意味着每一帧都需要进行特征点、描述子的提取、匹配等一系列操作，需要大量的迭代标定计算。光是单帧的计算量已经无法实现实时，更不论多帧的情况。

传统算法仍存在进步空间，旷视科技决定实现一个基于AI的优化算法。

对症下药找对位置，动态更新丝般顺滑

凭借多年来在基础科研方面的探索，旷视科技基于光流的多摄AI拼接算法，同时依靠实时动态无缝拼接网络模型，推出的全景视频实时拼接算法，有效解决了多摄拼接计算量大、拼缝明显以及拼接无法动态更新的技术难题。

运用了旷视全景视频实时拼接算法形成的全景视频，拼缝消失不见，行人经过原本拼缝处也流畅自然，不存在割裂感;即使放大很多倍，建筑楼宇上的字迹和远处建筑的边缘也依然清晰可见。不仅可视范围更广，分辨率更高，动态更新丝般顺滑，且速度比目前已知的较好拼接算法还要再快20倍。

为何旷视全景视频实时拼接算法，能够达到这样的效果?旷视的研究员表示，对症下药，才能更好地找到解题秘方。

一方面，全景视频拼接的趋势是从一个对齐变换，到多个变换，自然特出的效果应该是每个像素点都有一个对应，因此，旷视科技想到了利用光流来确定目标的运动情况。

另一方面，拼接算法无论是前向还是后向映射，遮挡问题都是一大难题。但是，参考时间上的插帧算法，不仅可以使视频更清晰流畅，空间上也可以插视角，构造连续虚拟的视角。

受到这些启发，旷视的研究员立即着手进行测试，终于在大半年后取得了突破性的进展，也在多种场景下对拼接质量和稳定性进行了可视化的评估。

全景视频实时拼接算法的核心在于把每个物体放到该放的位置上。为此，旷视估计了深度信息、光流信息，构建了一个物理世界并不存在的逐渐缓慢变化的视角，而这个虚构的视角和更大的广角表示很接近。

由于整个网络是一个端到端的nn网络，而光流估计、深度估计都可以在小尺寸上进行，整个算法可以实现实时拼接。

并且，因为构造的虚拟视角无论是在空间上还是在时间上都是连续的，所以不需要额外考虑帧间关系，拼接的视频会异常顺滑。

经过优化的算法，早已准备好创造价值

算法在需求中诞生，并在落地中创造越来越多的价值;而当下每一个被优化的算法，都意味着不久的将来，将会更好地应用于人类社会。

旷视全景视频实时拼接算法诞生的背后，正是行业对于全景视频的巨大需求。未来，全景视频实时拼接算法将在智慧城市管理、车载相机、消费电子、户外运动相机等领域被广泛应用。

例如在道路的交叉口，或者是大型广场等存在很多视觉盲区的场景，单个普通摄像头的视角非常受限，通过全景视频实时拼接算法形成的全景视频拥有更宽阔的视野和更高分辨率的图像，有助于城市管理者实现无盲区管理。

又比如在汽车驾驶领域，车辆行驶的过程中存在视觉盲区是引发交通事故很重要一个因素。如果全景视频实时拼接算法应用于车载相机中，就能够观测到车辆前后左右的情况，助力安全驾驶。

对旷视科技来说，基础科研是 AI 创新突破的基石，需要长期主义的坚持。从科研到落地，算法正在创造越来越大的价值，也在开始重新定义软硬件。全景视频实时拼接算法如此，其它的算法亦然。在旷视技术开放日的现场，还展示了双目3D相机、单目黑光、实时双超AI算法等超多的比较新科研成果。

视野所至之处，脚步才有机会到达。在旷视全景视频实时拼接算法容纳的无拼缝、流畅自然的广阔世界里，没有“裂缝”的美好生活也会如约而至。

（推广）

特别声明：以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布，本平台仅提供信息存储服务，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任，相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述法律文件后，将会依法依规核实信息，沟通删除相关内容或断开相关链接。

相关推荐

关键词：

悦点科技获中国信通院三重认可！荣登「2025高质量数字化转型产品及服务全景图」

2025年9月16日，中国信通院“铸基计划”联合中国互联网协会举办“2025数字生态发展大会暨铸基计划年中会议”。会议聚焦“洞见十五五”主题，汇聚政企学研代表探讨我国数字经济发展路径。悦点科技CTO孟嘉作为企业代表参会，其Knora-AI智能体开发平台及解决方案入选中国信通院高质量数字化产品全景图和技术解决方案集，并获评优秀案例。该平台致力于企业级智能体应用，�

数字经济智能体开发数字化转型
双会龙城圆满收官，全景回顾精彩瞬间

2025年第十四届中国智能产业大会与吴文俊人工智能创新大会首次联合举办，将于8月30-31日在江苏常州举行。大会聚焦人工智能与实体经济深度融合，通过学术引领与产业实践双轮驱动，搭建技术展示、成果转化、产城融合的高端平台。活动涵盖院士领衔报告、跨界圆桌对话及15场专题会议，探讨AI+产业转型路径，推动技术创新与产业升级，为长三角乃至全国提供可复制的常州经验。

人工智能智能产业科技创新
王腾因泄密被小米辞退博主数码闲聊站发声：与我无关

微博话题王腾因泄密被辞退”冲上热搜榜，引发热议。据凤凰网科技消息，小米集团职业道德委员会发布邮件，通报对王腾违规违纪的处理决定，中国区市场部员工王腾泄露公司机密信息，且存在利益冲突等严重违规违纪行为，公司决定给予王腾辞退的处分。随后博主数码闲聊站发布了一条微博表示，此事与我无关，明

泄密辞退数码闲聊站
央视三度对话君乐宝，解码中国乳业的全产业链革命

央视财经频道《对话·创新中国行》栏目播出君乐宝乳业专题，展现其全产业链创新模式。通过“种植-养殖-加工”零距离一体化布局，君乐宝实现从源头牧草种植到智能生产的全链条升级。节目重点呈现企业如何以技术创新提升品质，打造鲜奶密闭输送系统等专利技术，并通过多元产品满足消费需求。君乐宝模式成为乳业高质量发展标杆，助力国产奶粉市占率逆袭至70%，彰显民族品牌在全球产业链话语权提升。

中国乳业全产业链君乐宝模式
超越所见，开启银幕万象佳能发布搭载7K全画幅图像感应器、支持片门全开的数字电影摄影机EOS C50

佳能中国公司将于2025年11月推出EOS C50数字电影摄影机，搭载全新7K全画幅传感器和DIGIC DV7处理器，支持RF卡口。该机首次在CINEMA EOS系列中配备片门全开记录模式，支持竖拍裁切同步录制，具备双卡槽设计，可实现最高7K60P RAW录制。机身仅重670克，配备全像素双核自动对焦系统，支持多种视频格式和网络功能，适用于短片、纪录片、直播等多种创作场景。

佳能EOS C50 数字电影摄影机
海信变频S架构：引领全球变频技术，开启舒适省电新时代

海信空调在IFA2025展会上凭借变频S架构新品荣获多项创新大奖。该架构采用全栈自研技术，实现15秒速冷、30秒速暖，控温精度达±0.1℃，节能模式下电费可省50%。同时升级“金刚舱”与“信芯冰脉”技术，提升耐用性与极端环境适应性。产品承诺“10年不生锈”，满足用户对舒适与节能的双重需求。

IFA2025 家电盛会创新成果奖
2025网安周 | 每日互动总裁刘宇：AI时代，知识安全正成为全行业的必答题

2025年国家网络安全宣传周网络安全企业家座谈会在昆明举行。会议指出，网络安全正从合规驱动向风险驱动加速转型，需政府、企业、协会三方联动。头部企业要攻关芯片等关键技术，行业协会要发挥桥梁作用。每日互动总裁刘宇强调，AI时代知识安全成为新课题，需构建安全可信的人机交互环境。16家企业围绕产业高质量发展建言献策，共同推动网络安全产业创新突破。

网络安全数字经济企业家座谈会
给摄影加点创意 3000元档唯一半画幅微单佳能EOS R100体验

文章介绍佳能EOS R100微单相机，价格约3000元，性价比高。配备2410万有效像素，支持高精细照片和4K视频拍摄。机身仅重309克，轻便易携。通过手机App可远程操控，方便取景和自拍。内置创意滤镜功能，如颗粒黑白效果，适合即时分享。文章还提供多种创意拍摄技巧，如利用反光物体拼接空间、减法构图突出主体、慢门拍摄表现时间差异、光影运用增强画面立体感。鼓励多拍多�

摄影入门佳能EOS R100
雅迪华宇全球首发“天下无山”钠电平台，引领系统化电驱新时代

9月19日，第二十三届中国国际摩托车博览会在重庆开幕。雅迪集团旗下华宇电池与凌博电子联合发布“天下无山”四电钠动力平台，突破传统电动两轮车技术瓶颈，实现超长续航、极速快充、超强动力等特性。三款搭载该平台的新车型亮相，已完成超2万公里真实路测。该平台通过系统级设计解决行业痛点，推动电动出行向更高效、安全、智能方向发展。
网友编写微信瘦身代码！微信员工：可能带来很麻烦的后果

博主“木人舟”发布Python代码称可快速清理微信重复文件，但微信员工表示该代码无效且可能带来麻烦。微信采用硬链接技术，同一文件只存储一次，文件名后缀仅为避免重名冲突。该代码粗暴删除带(1)、(2)后缀的文件，既无法释放存储空间，还可能误删正常文件，强烈建议不要尝试。

微信去重 Python代码存储占用

今日大家都在搜的词：

热文

3 天
7天

旷视科技：聊聊旷厂黑科技-全景视频实时拼接，看见“视界之外”

悦点科技获中国信通院三重认可！荣登「2025高质量数字化转型产品及服务全景图」

双会龙城圆满收官，全景回顾精彩瞬间

王腾因泄密被小米辞退博主数码闲聊站发声：与我无关

央视三度对话君乐宝，解码中国乳业的全产业链革命

超越所见，开启银幕万象佳能发布搭载7K全画幅图像感应器、支持片门全开的数字电影摄影机EOS C50

海信变频S架构：引领全球变频技术，开启舒适省电新时代

2025网安周 | 每日互动总裁刘宇：AI时代，知识安全正成为全行业的必答题

给摄影加点创意 3000元档唯一半画幅微单佳能EOS R100体验

雅迪华宇全球首发“天下无山”钠电平台，引领系统化电驱新时代

网友编写微信瘦身代码！微信员工：可能带来很麻烦的后果

今日大家都在搜的词：

热文

小米召回116887辆SU7电动汽车：将OTA升级消除安全隐患

雷军回应小米召回11.7万辆SU7：将为用户带来更多期待功能

AI日报：小米开源首个原生端到端语音大模型；通义万相Wan2.2-A

苹果 iPhone 17/Pro 系列今日发售多维度升级

鸿蒙智行秋季发布会定档9月23日：尚界H5、新问界M7来了

京东：iPhone 17开卖4小时全国超3万人签收

小米平板8 Pro官宣搭载骁龙8至尊版处理器

小米开源首个原生端到端语音大模型支持音频重建任务和音频转

小米17 Pro系列外观公布：搭载“妙享背屏”

AI日报：可灵AI发布数字人新功能；腾讯混元新技术给大模型 “去

AI日报：腾讯发布混元3D 3.0模型；昆仑万维上线Agent Studio功

小米召回116887辆SU7电动汽车：将OTA升级消除安全隐患

理想i6定档9月26日上市：官方定义新形态五座SUV

雷军回应小米召回11.7万辆SU7：将为用户带来更多期待功能

AI日报：阿里云开源通义DeepResearch；夸克推医师考试大模型；

iPhone17 Pro Max续航实测夺冠 iPhone Air表现不俗

谣言！王腾并非因泄密小米16改名小米17遭辞退

小米发布REDMI 15R 5G手机：售价1099元起搭载6000mAh电池

站长商机