首页 > 业界 > 关键词  > 谷歌最新资讯  > 正文

谷歌详细介绍Project Starline 3D视频聊天室背后的技术

2021-12-02 20:19 · 稿源: cnbeta

在一份新的研究报告中,谷歌详细介绍了今年I/O大会上令人印象深刻的Project Starline演示的背后技术。Project Starline本质上是一个3D视频聊天室,旨在提供真人面对面体验来取代一对一的2D视频电话会议。

Google这篇研究论文强调了欺骗用户大脑,使其认为有一个真正的人坐在离用户几英尺远的地方,这其中有不少挑战。显然,图像需要高分辨率,没有干扰性的伪影,但它也需要从用户的相对位置看起来正确。音频是另一个挑战,因为系统需要让用户听起来像是从面对面真人嘴里说出的话。然后还有一个小问题,那就是眼睛的接触。

但是,Project Starline希望最终可以提供类似于虚拟或增强现实的存在感,而用户不需要佩戴笨重的头盔或追踪器。该报告详细说明了究竟需要多少硬件才能开始解决这些问题。该报告显示,该系统是围绕着一个大型的65英寸8K面板建立,该面板以60Hz运行。围绕着它,Google的工程师们安排了三个"捕获舱",能够捕获彩色图像和深度数据。该系统还包括四个额外的跟踪摄像机,四个麦克风,两个扬声器和红外投影仪。总的来说,从四个视点采集彩色图像,以及三个深度图,总共有七个视频流。音频采集频率为44.1kHz,编码速度为256Kbps。

显然,所有这些硬件都会产生大量需要传输的数据,Google表示,传输带宽从30Mbps到100Mbps不等,取决于用户衣服的纹理细节和他们手势的大小。因此,它需要的带宽明显高于标准的Zoom电话,但是低于大都市地区典型办公室提供的带宽。Project Starline配备了四块高端NVIDIA显卡(两块Quadro RTX 6000卡和两块Titan RTX)来编码和解码所有这些数据。据报道,端到端的延迟平均为105.8毫秒。

根据Google的说法,在Google三个办公室地点安装了Starline系统,使用该系统的员工认为,在创造存在感、个人联系以及帮助提高注意力和反应力时,它胜过传统的视频会议。该公司说,在9个月里,117名与会者共举行了308次会议,平均会议时间略高于35分钟。这一切听起来很有希望,但迄今为止,还没有迹象表明该系统何时甚至是否会被商业化。目前,Google表示它正在在美国各地更多的Google办公室当中扩大Starline项目的可用性。

举报

  • 相关推荐
  • LiblibAI 重磅发布「星流 Agent」:中文语义 + 图片视频3D全能生成,中国最强设计 Agent

    LiblibAI推出Lovart中文版"星流Agent",这是一款专为中国市场深度优化的AI设计工具。该产品在保留Lovart全球版"生成-编辑-排版-交付"全链路能力基础上,针对中文语义、国风审美和本土使用场景进行了全面重构。星流Agent支持从创意构思到设计交付的全流程自动化,可处理平面设计、视频生成和3D建模等跨模态创作,内置符合中国文化的视觉风格库。该产品的推出标�

  • 高德地图上线AR打卡功能:实现3D立体打卡 生成专属打卡视频

    阿里巴巴旗下高德地图正式上线创新AR打卡功能,通过深度整合AI技术与地图服务,为用户带来虚实融合的沉浸式打卡体验,无缝连接现实世界。 该功能依托前沿AI空间融合技术,突破传统二维地图限制,首创3D立体打卡。用户打开最新版高德地图App,点击右上角 ”号即可轻松开启AR之旅。 支持图片、视频、趣味AR道具及虚拟形象等多种打卡形式,完成打卡后系统将自动生成并

  • 剑指谷歌Chrome!OpenAI即将推出AI浏览器

    据媒体报道,OpenAI即将推出的AI浏览器,利用人工智能技术彻底重塑用户的网络浏览体验,直接向占据市场主导地位的谷歌 Chrome 发起挑战。 凭借庞大的每周4亿活跃ChatGPT用户基础,OpenAI的浏览器若被广泛接纳,将对谷歌的广告生态系统、网络数据流和搜索流量构成实质性威胁。谷歌Chrome长期以来是Alphabet广告业务的基石,为其精准广告投放和将流量导向自家搜索引擎提供了关�

  • 从万元配置到千元普及, TCL T6L Pro以领先技术带来越级体验

    2025年Q1中国电视市场出货量达884万台,同比增长4.7%。TCL表现亮眼,出货量超200万台位居行业第一,618期间更斩获各平台成交额冠军。其成功源于全产业链布局和技术创新:拥有全球最大模组整机一体化工厂TCL华星,是唯一具备Mini LED全产业链闭环的中国企业,2024年研发投入超140亿元,专利数全球第二。新品T6L Pro搭载"蝶翼星曜屏"等高端技术,将万元级配置下沉至3000元档,实现0.5%超低反光率和1.8%整机反射率,配备量子点Pro2025技术覆盖96%DCI-P3色域,独创万象分区背光技术提升画质。通过技术普惠战略,TCL正重塑行业价值标准,推动高端技术大众化发展。

  • 探索AI时代出海新范式!impact.com荣获TopDigital创新营销奖「年度营销技术公司」

    2025年7月1日,impact.com在第十三届TopDigital创新营销盛典上荣获"年度营销技术公司"大奖。该平台凭借技术能力、商业影响和全球化战略的综合表现获得认可,其AI技术正深刻改变品牌营销工作方式,尤其在效率提升与流程优化方面成效显著。impact.com通过智能推荐、智能审批等功能,将AI能力引入合作伙伴管理核心环节,帮助出海企业构建全球化合作网络。大中华区总裁Jennifer Zhang表示,AI不是替代营销人,而是释放其判断力与创造力。作为全球合作伙伴经济核心引擎,impact.com已服务众多中国出海品牌,未来将继续深化AI在营销管理平台的应用。

  • A日报:B站升级动漫视频生成模型AniSora V3;字节开源4D视频生成框架EX-4D;DeepSWE开源AI Agent系统强势登顶

    AI日报栏目汇总了近期AI领域的重要进展:1)字节跳动开源EX-4D框架,可将单目视频转换为多视角4D视频;2)B站开源动漫视频生成模型AniSora V3,支持多种风格;3)DeepSWE+开源基于Qwen3-32B的AI Agent系统;4)字节开源3亿参数图像编辑模型VINCIE-3B;5)Stability AI推出移动端音频生成模型Stable Audio Open Small;6)谷歌发布免费教育AI工具套件Gemini for Education;7)Topview推出革命性AI数字人带货技术Avatar

  • AI日报:腾讯混元推3D生成大模型Hunyuan3D-PolyGen;钉钉AI表格重磅来袭;阿里推多模态大语言模型HumanOmniV2

    本文介绍了AI领域多项重要进展:1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen,显著提升建模效率;2)阿里发布多模态大模型HumanOmniV2,准确率达69.33%;3)钉钉AI表格实现1小时处理千项任务;4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级;5)微软推出Deep Research智能体,自动化研究流程;6)香港理工与OPPO联合开源视频超清框架DLoRAL;7)谷歌开源MCP工具箱简化AI与数据库集成;8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。

  • ppt自动生成工具最好用的3个

    文章介绍了当前AI生成PPT工具的发展现状,重点推荐了"秒出PPT"这一专业平台。该平台具有三大特色功能:1)智能对话式生成,支持中途修改需求;2)提供三种编辑模式(纯文本、纯设计和文本+设计);3)支持导入文档自动排版,提供"保持原文"和"AI智能修改"两种模式。平台还拥有丰富的模板库,支持在线更换颜色、字体等设计元素。虽然需要购买会员,但相比市面上质量参差不齐的同类产品,该工具在交互体验和功能完整性上表现突出。

  • 用领先技术破局,TCL电视以技术普惠战略树立行业标杆

    2025年第一季度,TCL电视全球出货量达651万台,同比增长11.4%,其中Mini LED电视出货量激增194.5%,市占率28.8%跃居全球第一。在国内市场,TCL电视618大促期间成交额登顶多平台榜首。文章指出,消费者需求正从"唯价格论"转向"唯价值论",75英寸以上大尺寸电视出货量同比增长45.4%。TCL T6L Pro新品通过"蝶翼星曜屏"实现7000:1超高对比度,配合"万象分区"技术提升控光效果,搭载1300nits绚彩XDR和量子点Pro2025技术,支持96% DCI-P3色域。灵控系统3.0实现0.7秒极速开机,支持NAS协议播放。这些创新技术使TCL在疲软市场中实现逆势增长,体现了"技术普惠"理念。

  • 国内详细MCP教程网站有哪些?MCP服务资源平台去哪找?

    在当今快速发展的AI技术浪潮中,Model Context Protocol(MCP,模型上下文协议)作为一种新兴的开放标准协议,正逐渐成为AI领域的重要组成部分。 今天,我们有幸介绍一个专注于MCP服务器和相关服务的集合平台——AIbase。 AIbase平台为全球的AI开发者和爱好者提供了一个全面的MCP服务器资源库。据最新统计,该平台已经收录了超过 121231个 MCP服务器,涵盖了从热门推荐到最近更新�