首页 > 业界 > 关键词  > Transframer最新资讯  > 正文

Google人工智能技术“Transframer”可根据一张图片创建短视频

2022-08-21 11:21 · 稿源: cnbeta

随着技术的发展,研究人员继续寻找新的方法来利用人工智能和机器学习能力。本周早些时候,Google科学家宣布创建了Transframer,这是一个新的框架,它能根据单一的图像输入来生成短视频。这项新技术有朝一日可以增强传统的渲染解决方案并使开发者能够基于机器学习能力创建虚拟环境

这个新框架的名称(及在某些方面的概念)是对另一个基于人工智能的模型Transformer的点赞。Transformer最初于2017年推出,是一个新颖的神经网络架构,它有能力通过建模和比较句子中的其他词来生成文本。此后,该模型被纳入了标准的深度学习框架如TensorFlow和PyTorch。

据悉,Transframer使用具有类似属性的背景图像,结合查询注释来创建短视频。尽管在原始图像输入中没有提供任何几何数据,但产生的视频在目标图像周围移动并将准确的视角可视化。

这项新技术使用Google的DeepMind人工智能平台进行了演示,其功能是分析单一的照片背景图像以此来获得关键的图像数据并生成额外的图像。在这一分析过程中,系统确定了图片的框架,这反过来又帮助系统预测图片的周围环境。

然后,语境图像被用来进一步预测图片从不同角度会出现的情况。预测根据数据、注释及语境框架中的任何其他信息对额外图像框架的概率进行建模。

该框架通过提供基于非常有限的数据集生成合理准确的视频的能力,这标志着视频技术的巨大进步。Transframer任务在其他跟视频有关的任务和基准上也显示出极有前景的结果,如语义分割、图像分类和光流预测。

对基于视频的行业如游戏开发可能具有潜在的巨大影响。目前的游戏开发环境依赖于核心渲染技术,如着色、纹理映射、景深和光线追踪。像Transframer这样的技术有可能通过使用人工智能和机器学习来构建他们的环境并与此同时来减少创建环境所需的时间、资源和精力以为开发者提供一个全新的开发路径。

举报

  • 相关推荐
  • 马上消金助力:“人工智能+消费”场景革新与市场破局

    文章探讨了"人工智能+消费"新模式如何改变生活。智能家居系统通过语音控制实现便捷操作,还能监测用户状态主动调节环境;智能购物平台利用AI分析用户偏好,提供个性化推荐;文旅行业应用AI导览和数字体验项目,提升游客体验。数据显示,AI消费市场潜力巨大,超七成消费者愿为AI功能支付溢价。文章指出需构建AI治理新生态,加强数据安全保护,培养复合型人才,推动"人工智能+消费"健康发展。

  • 姜钧凯:人工智能已经驱动硬件体系大变革

    爱国者集团CEO姜钧凯在2025中国人工智能产业领军论坛上指出,人工智能正推动硬件体系大变革。他回顾30年科技发展规律:每十年软硬件互相促进一次飞跃,从1993年电脑硬件、2003年数码产品到2013年智能穿戴,再到2023年后AI大模型兴起。姜钧凯透露,科学家正在研发基于金刚石芯片和碳基存储的新一代硬件系统,其中同位素电池技术尤为突破——采用碳14同位素衰变原理,可实现百年免充电,且安全无辐射。爱国者已布局强人工智能软硬件体系,包括居家养老系统、数据清洗平台及以金刚石芯片为核心的硬件研发。姜钧凯预测2056年将迎来超级人工智能时代,人类只需从事创造性活动。论坛上,爱国者还展示了针对自闭症儿童的水晶疗愈等创新应用。多位科学家高度评价爱国者对中国科技发展的贡献。(宋洁凡)

  • 腾讯混元T1-Vision上线元宝:一张图片就能分析出产品研发成本

    除此之外,腾讯还介绍了元宝目前可以识别花的品种;可以提示在围棋赛局中下一步如何走;同时,给它一张定期存款利率表,还会帮你出谋划策。

  • 阿里云携手博登智能,升级AI数据标注服务——以数据驱动人工智能

    博登智能与阿里云达成战略合作,共同推动AI数据标注智能化发展。博登智能自主研发的BASE平台通过AI技术实现数据标注自动化,最高提升600%效率,降低成本40%,已服务自动驾驶、智慧医疗等领域。双方将结合博登的数据服务优势与阿里云的技术实力,构建从数据采集到模型训练的全流程解决方案,推动AI技术在千行百业落地。此次合作将加速数据智能服务升级,让更多企业以更低门槛拥抱AI技术。

  • 科大讯飞等在湖北成立两家新公司 均涉及AI人工智能

    湖北小雅科技有限公司注册资本5000万元人民币,法定代表人为聂小林,经营范围涵盖人工智能应用软件开发、基础软件开发及理论与算法研究等细分领域。股东结构显示,该公司由科大讯飞旗下子公司讯飞华中(武汉)有限公司联合武汉博成众智科技投资合伙企业(有

  • 师出有名:华城瑞讯首创人工智能平台 共建数智企服生态

    华城瑞讯创始人高瑞先拜访中国中小企业协会,双方围绕小微企业数智化服务、企服咨询师行业标准建设等议题展开交流。协会成立于2006年,致力于服务中小企业发展。华城瑞讯自主研发的"22°智·企服"Agents系统获高度认可,其融资服务模块可将融资周期缩短60%,成本降低50%。公司计划推出企服咨询师培训计划,建立OMO服务模式,整合银行、律所等专业资源。目前"22°智·融资"Agent已促成近20个千万级融资项目落地,覆盖智能制造、数字科技等领域。未来将共建数智企服新生态,在全国重点城市增设服务空间,助力小微企业在数字经济浪潮中实现跨越式发展。

  • 手机满意度跌至 10 年来的最低水平,AI人工智能只是部分原因

    手机用户的整体满意度从去年的 82% 降至 78%。乍一看似乎只是小幅下降,但这其实是 近十年来的最低分,而去年还创下了历史最高纪录……

  • AI赋能| 2025“人工智能+行动”大讲坛在上海圆满成功

    2025年5月18日,"人工智能+行动"高峰论坛在上海成功举办。活动聚焦"技术+场景+人才"三大核心,汇聚政产学研界500余位精英,探讨AI在八大领域的创新应用。论坛发布DS&AI创新院2.0版,推出"三包"赋能计划:资源包共享30余位专家智库,技术包提供定制化AI解决方案,人才包培养2000+AI专业人才。多位专家指出,中国正从AI"跟跑者"跃升为全球"领跑�

  • Google点燃了智能眼镜的导火索

    「Gemini,我刚才喝的那杯咖啡的咖啡馆叫什么?」 这是Google员工Nishtha两分多钟前在I/O大会后台做的一个动作,在此之后,她又和人打了招呼,并用智能眼镜识别了后台墙上的照片属于哪个乐队,然后又走到了I/O大会的舞台上和大家打了招呼。一系列动作后,Google的智能眼镜还是准确地帮她识别出这杯咖啡应该来自Castro街的Bloomsgiving咖啡馆。

  • 怎么在 Chrome 浏览器中使用 Google Lens?

    Google Lens 是一款基于图像识别和OCR技术的人工智能应用,能够让机器学会“看图说话”,它能实时识别用智能手机相机所拍摄的物品、并提供与之相关的内容……