首页 > 传媒 > 关键词  > 全景相机最新资讯  > 正文

旷视科技:聊聊旷厂黑科技-全景视频实时拼接,看见“视界之外”

2024-08-16 11:42 · 稿源: 站长之家用户

120度,是人类双眼视野的大致范围。

为了用更宽阔的视野观察、记录这个世界,人们开始使用工具,希望将整个世界都纳入画面中。为此,能同时拍摄整个空间画面的全景相机出现了。

早期的全景相机需要固定在一个旋转云台上,拍摄前拧紧发条,然后旋转相机进行拍摄。不仅手段繁琐,而且由于旋转速度较慢,拍摄画面中的人物需要长时间保持固定姿势。

进入数码相机时代,照片的获得与后期处理变得更加便捷,厂商们各显神通,全景相机的类型和功能也日益丰富。2006年,瑞士赛兹公司发布了一台6x17Digital相机,这个“大家伙”外形尺寸为495x175x95cm,感光器有6x17cm、比较高分辨率达7500x21250px、获得的相片总像素接近1.6亿,并且,仅机身的价格就高达几十万人民币。

为了打破全景相机庞大笨重、售价不菲的特质,厂商开始寻求其他的解决方法,“扫描全景模式”就是其中之一。比如索尼HX1,相机在全景拍摄模式下,会在按下快门时快速连续扫描被摄物体,并在机内自动寻找相同色块自动拼接。该方式面对静止的物体时能以非常简单的方式获得全景拍摄效果,可是却不能准确判断画面中移动的物体,容易形成重影。

与此同时,随着人们观察与记录世界的视角越来越多元化,视频也成为记录日常的主要方式之一,能够容纳更多信息、视觉冲击力更大的全景视频更是深受人们的喜爱,逐渐成为了主流发展方向。然而相对于静态的全景照片而言,动态的全景视频的实现对技术有着更高的要求,硬件升级成本居高不下。

因此,以AI算法弥补硬件升级的不足,打造全景视频拼接技术成为了新探索方向。

01

拼接技术“曲线救国”,全景视频痛点依旧

所谓全景视频拼接技术,即多个摄像头在同一场景下采集不同方向的视频,后期逐帧拼接,最终得到360度全景视频,甚至360度*180度的球面全景视频。

但是,目前行业里的全景视频拼接技术仍存在一些尚未解决的问题。

首先是多摄拼接计算量大。传统的拼接算法需要提取图像中的特征点、描述子进行匹配,之后反复迭代得到特出的对齐关系,但在相机标定对齐的过程中会产生大量的计算。

其次是视频拼接存在明显拼缝。即使是在计算量非常大的情况下,也需要对于相机之间的关系进行一定的假设,如共光心模型无法适用于大视角,目前即使是网格法求出多组匹配关系也无法应对由于大视角导致的物体拉伸扭曲变形。目前的算法增加了对于扭曲的约束,但不能从根本上解决问题。

另外,还存在拼接无法动态更新。视频拼接技术中存在一个普遍的问题,那就是运动物体在重合区域会产生虚影,就像将手指放在两眼之间前后移动时会出现虚影一样。要解决这个问题,需要随时将相机的光心聚焦到目标点,不断变换拼接模板;同时,为了使拼接的视频流畅,还需要考虑到单帧间信息。这意味着每一帧都需要进行特征点、描述子的提取、匹配等一系列操作,需要大量的迭代标定计算。光是单帧的计算量已经无法实现实时,更不论多帧的情况。

传统算法仍存在进步空间,旷视科技决定实现一个基于AI的优化算法。

02

对症下药找对位置,动态更新丝般顺滑

凭借多年来在基础科研方面的探索,旷视科技基于光流的多摄AI拼接算法,同时依靠实时动态无缝拼接网络模型,推出的全景视频实时拼接算法,有效解决了多摄拼接计算量大、拼缝明显以及拼接无法动态更新的技术难题。

运用了旷视全景视频实时拼接算法形成的全景视频,拼缝消失不见,行人经过原本拼缝处也流畅自然,不存在割裂感;即使放大很多倍,建筑楼宇上的字迹和远处建筑的边缘也依然清晰可见。不仅可视范围更广,分辨率更高,动态更新丝般顺滑,且速度比目前已知的较好拼接算法还要再快20倍。

为何旷视全景视频实时拼接算法,能够达到这样的效果?旷视的研究员表示,对症下药,才能更好地找到解题秘方。

一方面,全景视频拼接的趋势是从一个对齐变换,到多个变换,自然特出的效果应该是每个像素点都有一个对应,因此,旷视科技想到了利用光流来确定目标的运动情况。

另一方面,拼接算法无论是前向还是后向映射,遮挡问题都是一大难题。但是,参考时间上的插帧算法,不仅可以使视频更清晰流畅,空间上也可以插视角,构造连续虚拟的视角。

受到这些启发,旷视的研究员立即着手进行测试,终于在大半年后取得了突破性的进展,也在多种场景下对拼接质量和稳定性进行了可视化的评估。

全景视频实时拼接算法的核心在于把每个物体放到该放的位置上。为此,旷视估计了深度信息、光流信息,构建了一个物理世界并不存在的逐渐缓慢变化的视角,而这个虚构的视角和更大的广角表示很接近。

由于整个网络是一个端到端的nn网络,而光流估计、深度估计都可以在小尺寸上进行,整个算法可以实现实时拼接。

并且,因为构造的虚拟视角无论是在空间上还是在时间上都是连续的,所以不需要额外考虑帧间关系,拼接的视频会异常顺滑。

03

经过优化的算法,早已准备好创造价值

算法在需求中诞生,并在落地中创造越来越多的价值;而当下每一个被优化的算法,都意味着不久的将来,将会更好地应用于人类社会。

旷视全景视频实时拼接算法诞生的背后,正是行业对于全景视频的巨大需求。未来,全景视频实时拼接算法将在智慧城市管理、车载相机、消费电子、户外运动相机等领域被广泛应用。

例如在道路的交叉口,或者是大型广场等存在很多视觉盲区的场景,单个普通摄像头的视角非常受限,通过全景视频实时拼接算法形成的全景视频拥有更宽阔的视野和更高分辨率的图像,有助于城市管理者实现无盲区管理。

又比如在汽车驾驶领域,车辆行驶的过程中存在视觉盲区是引发交通事故很重要一个因素。如果全景视频实时拼接算法应用于车载相机中,就能够观测到车辆前后左右的情况,助力安全驾驶。

对旷视科技来说,基础科研是 AI 创新突破的基石,需要长期主义的坚持。从科研到落地,算法正在创造越来越大的价值,也在开始重新定义软硬件。全景视频实时拼接算法如此,其它的算法亦然。在旷视技术开放日的现场,还展示了双目3D相机、单目黑光、实时双超AI算法等超多的比较新科研成果。

视野所至之处,脚步才有机会到达。在旷视全景视频实时拼接算法容纳的无拼缝、流畅自然的广阔世界里,没有“裂缝”的美好生活也会如约而至。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 央视探访海信空调实验室,揭秘赛场外的黑科技

    央视财经探访海信研发中心,揭秘其作为世俱杯官方合作伙伴的技术实力。海信新风空调X7Pro采用双向流换新风技术,3分钟实现全屋空气净化;16分贝超轻音设计,比小猫走路声更安静;极端气候测试显示,其能在-30℃至68℃稳定运行。权威机构认证,使用海信空调7小时睡眠效果相当于传统空调8小时。凭借健康舒适的新风技术,海信空调成为球迷票选的"满分看球空调",提供观赛和补眠的全方位舒适体验。未来海信将持续创新,为用户打造更智能健康的家居空气解决方案。

  • 刷屏世俱杯的RGB-Mini LED有多能打?央视拆机探秘看球黑科技

    海信在2025世俱杯期间展示了其RGB-Mini LED电视技术,通过红绿蓝三原色独立背光光源实现更纯净色彩和更高能效。相比传统电视需要二次色彩转换,该技术直接呈现原色,解决了拖影、色偏等问题,能效提升20%以上。海信通过自主研发的AI画质芯片和RGB背光芯片,攻克了三原色同步控制等技术难题。该技术已应用于85-116英寸大屏电视,成为行业认可的下一代显示方向,标志着中国显示技术从跟随到引领的跨越。

  • 国内有哪些ai大模型?一文看懂中国核心AI大模型全景

    近两年中国AI大模型发展迅猛,已形成"通用+行业"双轨并进的生态格局。百度文心一言、阿里通义千问等通用大模型在中文理解、多模态生成等方面表现突出;深度求索DeepSeek以1/10参数实现GPT-4级推理能力;月之暗面Kimi以20万汉字上下文窗口领跑长文本处理;智谱AI的GLM-4成为首个支持视频对话的国产千亿模型。医疗、金融等垂直领域涌现出百川智能等专业模型,覆盖超1000家医院。开源生态加速国产芯片适配,15家厂商完成深度优化。行业应用方面,工程文档效率提升60%,24小时拟人化客服等案例凸显价值。未来趋势呈现模型蒸馏、端侧部署和开源生态三大方向,中国AI正从实验室走向产业变革前沿。

  • 强者相遇!奥运冠军田亮空降TCL奥运中国行重庆站解锁黑科技!

    6月25日,TCL在重庆启动"奥运中国行"首站活动,作为奥运会全球合作伙伴,推出行业首款第四代液晶电视极景·无黑边98C12K等创新产品。活动融合体育精神与科技基因,通过沉浸式体验展示TCL全屋智能生态。TCL实业中国区总裁卢春水表示,成为奥运合作伙伴是对品牌实力的认可,未来将持续投入显示技术创新。现场奥运冠军田亮参与互动,体验TCL冰箱、洗衣机等产品。数据显示,TCL Mini LED电视连续5年中国销量第一,2024年全球出货量再创新高。活动展现了TCL"冠军品质,全球领先"的科技实力,未来将继续推动"科技+体育"跨界融合,强化全球品牌认知。

  • 喜临门为何选择强脑科技?AI睡眠科技互补下的战略共鸣

    全球首款脑机接口AI床垫"宝蕖·BrainCo"正式亮相,标志着智能家居领域迎来革命性突破。该产品通过非侵入式脑机接口技术实时监测脑电信号,动态调整床垫参数,实现从"智能助眠"到"智慧陪伴"的跨越。喜临门与强脑科技的战略合作,将推动睡眠科技从硬件舒适向健康管理升级,响应"健康中国2030"战略。双方将共同研发精准睡眠监测技术,填补行业空白,并构建覆盖检测、干预到健康管理的全链条睡眠解决方案。

  • 别让暑假毁了孩子视力!百寸激光电视四大黑科技 实现“5个0”真护眼

    暑期儿童近视问题加剧,数据显示暑假期间近视增长率是学期内的3倍,90%以上孩子日均使用电子屏幕超5小时。传统大屏电视护眼效果存误区,实际蓝光强度更高。海信激光电视星光S1纯享版2026款采用纯净激光光源,精准控制蓝光波长,获得0有害蓝光认证,配合漫反射技术模拟自然光观看体验,临床数据显示其视觉舒适度比纸质阅读高20%。该产品还具备影院级视听体验,采用DLP数字影院技术实现110%DCI-P3色域,配备帝瓦雷音响系统。目前正值首发优惠期,消费者可通过京东、天猫等平台预约购买。

  • 谷雨披露首份ESG报告 呼应科技与文化双轮驱动

    谷雨生物科技集团发布首份ESG报告,展现"科技+文化"双轮驱动战略。报告重点披露了公司在光甘草定、稀有人参皂苷CK等核心原料的科研突破:推出纯度99%的"极光甘草"原料,实现2000倍提升人参皂苷CK含量。同时,谷雨在新疆建立百亩光果甘草种植基地,形成"种植-就业-创新-应用"完整生态链。文化方面,谷雨设立"思源·谷雨公益基金"推动非遗保护,并将敦煌壁画等传统元素融入产品设计。此外,公司发起"雨木共生"计划,通过空瓶回收制作环保课桌椅捐赠山区学校,累计减少17吨碳排放。

  • 趣链科技开启RWA项目战略合作

    趣链科技与贵州勘设泰宇行科技、翰凯斯智能签署战略合作协议,三方将围绕智能网联汽车运营服务平台建设、智慧交通数字化转型等领域展开合作。重点包括:1)构建"车-路-云-链"智能网联服务平台;2)探索交通动力和运营装备的RWA(现实世界资产)试点应用;3)打造以可信数据为基础的出行科技产业新生态。此次合作将发挥区块链技术优势,推动绿色出行场景下新型融资机制建设,助力中小型智能出行企业可持续发展。交通动力领域是RWA应用的核心场景,也是趣链科技创新战略的重要方向。

  • 金融科技产业联盟第三届理事会第四次常务理事会成功召开深信服分享AI赋能科技金融安全观点

    6月27日,北京金融科技产业联盟第三届理事会第四次常务理事会在京召开。会议审议通过了5家机构加入联盟、5家机构退出联盟,22家会员单位加入专委会,华为技术有限公司担任人工智能专委会副主任委员单位。会议审议通过4项团体标准报批材料,并围绕"金融大模型安全应用"展开交流。深服科技分享了AI赋能金融安全韧性的新生态,其AI大模型赋能数据安全效果显著,相比传统引擎准确率提升30%,风险事件检出率提升40%。会议强调金融行业要加强人工智能大模型应用发展环境培育,强化需求管理与投入产出评估,精准匹配业务场景。会议要求联盟发挥平台作用,在推动AI赋能金融服务质效的同时,加强防范新技术应用可能带来的风险。

  • 回来了!“星纪魅族科技”公众号名称改为“魅族科技”

    近日,星纪魅族科技”公众号名称改为魅族科技”。 其实原本该公众号的名称就是魅族科技,但是在2024年8月改为星纪魅族科技”,也算是被收购之后的一项重要举措,当时魅族全网账号基本都统一了命名。