首页 > 业界 > 关键词  > 机器学习最新资讯  > 正文

Twelve Labs使视频内部搜索变得简单而强大

2022-03-17 08:00 · 稿源: cnbeta

随着视频在我们日常互动和创造的媒体中占的比重越来越大,跟踪和索引这些内容的需求也越来越大。Twelve实验室有一个总结和搜索视频的机器学习解决方案,可以使消费者和创作者更快、更容易。

这家初创公司提供的能力是能够输入一个复杂但模糊的查询,如"Courtney唱国歌的办公室聚会",并立即得到不仅是视频,而且是视频中发生的时刻。在YouTube或大学档案馆里,你经常可以找到你想要的视频。但接下来会发生什么?你翻阅视频,寻找你要找的部分,或者翻阅文字记录,试图想出他们措辞的确切方式。

这是因为当你搜索视频时,你实际上是在搜索标签、描述和其他基本元素,这些元素很容易被大规模地添加。在浮现你想要的视频方面,有一些算法的魔力,但系统并没有真正理解视频本身。业界已经将问题过度简化,认为标签可以解决搜索问题。而现在许多解决方案确实依赖于,例如,识别出视频的某些帧包含猫,所以它添加了标签#cats。但是视频不仅仅是一系列的图像,而是复杂的数据。

Twelve实验室建立一个新的神经网络,它可以同时接受视觉和音频,并围绕它制定上下文;这被称为多模态理解。这是目前人工智能领域的一个热词,因为当人工智能系统狭隘地专注于一种"感觉",如音频或静态图像时,我们似乎已经达到了理解世界的极限。例如,Facebook最近发现,它需要一个人工智能同时关注一个帖子中的图像和文字,以检测错误信息和仇恨言论。

对于视频,如果你看的是单个帧,并试图用带有时间戳的文字记录来进行联想,你的理解就会受到限制。当人们观看视频时,他们会自然地将视频和音频信息融合到角色、行动、意图、因果关系、互动和其他更复杂的概念中。

Twelve实验室声称其视频理解系统已经建立了类似的东西。人工智能被训练成从多模态的角度来处理视频,从一开始就将音频和视频联系起来,并创造他们所说的更丰富的理解,其中包括更复杂的信息,比如画面中项目之间的关系,连接过去和现在,就比如说,如果有一个YouTuber搜索“Beast先生挑战Joey Chestnut吃汉堡”,它就会理解挑战某人,以及谈论挑战的概念。

Twelve实验室将其工具构建成一个简单的API,可以被调用来索引一个视频(或一千个),生成一个丰富的摘要,并将其连接到一个选定的图表。因此,如果你记录了所有的手拉手会议或技能分享研讨会或每周的头脑风暴会议,那些变得可搜索,不仅仅是按时间或与会者,而是按谁说话,什么时候,关于什么,并包括其他行动,如画图或展示幻灯片等等信息。

举报

  • 相关推荐
  • Meta重组仍在继续,Reality Labs部门裁员超百人

    “提高绩效管理的标准,让绩效低下的员工尽快下岗”,扎克伯格在此前的备忘录中如是写道。同时,还敦促员工要提高积极性……

  • AI革新了电子商务营销:认识AID Lab的PhotoG

    在当今快速发展的消费格局中,全球生活方式市场前所未有地蓬勃发展。在Z时代重视个性化体验的消费者的推动下,从家居装饰到日常必需品的行业正在经历前所未有的繁荣。通过提高创意效率和实现卓越的消费者体验,PhotoG有望重新定义技术、设计和商业之间的交叉点。

  • AI金融 ‧ 数启亚洲——港投公司与WeLab汇立集团宣布启动战略合作

    2025年4月10日,中国香港——2025年4月10日,中国香港——香港投资管理有限公司与亚洲领先的金融科技平台WeLab汇立集团将透过战略合作,共同在金融科技界推动AI创新及应用,并加强金融科技人才培育,以促进普惠金融在亚洲的发展。港投公司的投资与作为在香港孵化成长,并在东南亚发展的最大金融科技公司的WeLab汇立集团战略合作,将为亚洲汇聚更大的市场活力和资金流,巩固和提升香港国际金融和创新科技中心的竞争力与影响力,并为本港经济增添动能。为响应这次战略合作,WeLab汇立集团目标于2025年内透过全面培训计划,提升全体员工利用AI驱动金融服务的能力,促进创新并继续引领金融科技的未来发展。

  • 国产首款F1.2全画幅自动对焦!唯卓仕AF 35mm F1.2 LAB FE正式登场

    继首款LAB系列镜头AF135mm F1.2 LAB惊艳市场后, 4 月 16 日,唯卓仕再度推出AF 35mm F1.2 LAB FE镜头,作为国产首款支持全画幅相机的F1. 2 超大光圈自动对焦镜头,这款镜头不仅延续了LAB系列对极致画质的追求……

  • 有心理问题找 ChatGPT?但研究表明:AI也会变得焦虑……

    24岁的大学生A某患有重度抑郁症和恐慌症。由于上学时会突发惊恐发作,因此即使是正常出勤于他言那都很困难,甚至上学期间收到了退学警告。研究团队表示,本次研究“暗示着AI能够在心理健康管理领域发挥重要作用”、“正在探索将AI用作心理健康专家辅助工具的方法,且将重点放在了提高对弱势群体的可及性上”。

  • 刚刚,OpenAI大更新ChatGPT搜索,周搜索量10亿次

    OpenAI对ChatGPT搜索功能进行重大升级,重点优化网购体验。现在用户可直接搜索商品并查看价格、详情和评价,还能跳转购买链接。该功能面向所有用户开放,支持中英文搜索,搜索结果会匹配提示词语言。过去一周搜索量已超10亿次,成为ChatGPT核心功能之一。新功能让用户能直接在ChatGPT完成商品比价和购买决策,大幅简化网购流程。虽然目前主要通过导流变现,但未来可能拓展更多电商服务。这次升级标志着ChatGPT正从纯聊天工具向多功能平台演进。

  • 轻巧便携 大有乾坤 三星Galaxy Tab S10 FE正式上市

    三星Galaxy Tab S10 FE系列平板电脑4月26日国内上市,包含标准版和Plus版两款机型。新品采用轻薄大屏设计,分别搭载不同尺寸显示屏,支持90Hz刷新率,配备Exynos 1580处理器。Plus版采用13.1英寸超大屏,可视面积较上代提升12%。全系支持S Pen触控笔、AI智能功能及多任务处理,具备IP68防护等级。提供12GB+256GB和8GB+128GB两种存储规格,售价3499元起,支持5G网络版本可选。购买可享国家补贴政策,用户可通过线上线下渠道选购。

  • 三星Galaxy Tab S10 FE火热预约中 轻薄大屏值得你拥有

    便携大屏让使用更便利,S Pen为学习与工作赋能,一直以来,三星Galaxy FE系列平板都以多元化功能和对消费者需求的深入洞察,成为用户的好伙伴。而随着人工智能时代的到来,新一代三星Galaxy Tab S10 FE系列也同样焕新而至,将高效、强悍、稳定的体验与丰富实用的三星智能功能带给更多年轻用户。高亮绚丽大屏 宽广视野不受限作为主打大屏体验的三星GalaxyFE系列新品,三星Gala

  • 三星Galaxy Tab S10系列:AI大屏 假期出游必备

    度过忙碌的三月,四五月份随之来的假期正向着我们招手,被工作和学业束缚了太久的你想必早已期待值拉满。要想拥有最佳的出游体验,可以使用三星GalaxyTabS10系列平板电脑,提前找攻略安排清楚行程,并订好门票和酒店,利用其AI大屏与高效的多任务功能,让假期出游安逸更省心。趁春光未老,去看世界的辽阔,让心灵在旅途中自由舒展吧!

  • 简单圈选 智能预判 教程式解读三星Galaxy S25的AI多截图功能

    截图是每位智能手机用户的日常操作,但在AI的赋能之下,三星GalaxyS25系列将这一基础功能,进化成了一套高效、智能的全能辅助工具。全新搭载的AI多截图功能,不仅能记录屏幕信息,更能理解用户截图的“目的”,并据此提供后续操作建议,让截图不止于记录成为效率与创意的起点。AI不再只是卖点成为日常中潜移默化、始终在线的超级助手。