首页 > 动态 > 关键词  > 阿里巴巴最新资讯  > 正文

阿里AI视频识别算法新突破:可帧级解读视频

2018-09-14 11:26 · 稿源: 快科技

手机里存了大量的视频,想剪辑其中的精彩片段却犹如大海捞针?视频网站拥有海量视频,如何严格审核避免问题发生?

近日,在德国慕尼黑举办的计算机视觉国际顶会ECCV(European Conference on Computer Vision)上,阿里安全图灵实验室高级算法专家析策展示了最新的AI视频识别算法,其识别精度超越目前主流方法,有效提升了视频自动标签的行业精度,这一新算法已被ECCV收录。

阿里安全图灵实验室高级算法专家析策表示,为提升AI技术在实际场景中针对视频识别的精度,提出一种新的基于图(Graph)的视频建模方法,能表达含有复杂事件内容的长视频。

析策表示,这一方法的主要思路是通过“深度卷积图神经网络”(下称“DCGN”)对视频的帧、镜头、事件进行多级的建模,逐渐地从帧级、镜头级,一直到视频级进行抽象,从而获得视频全局的表达,进而进行分类。

他举例称,“比如一段美食节目视频中,包含厨师长、主持人聊天、食物、观众等内容,AI在学习视频内容时会先根据内容对视频进行逐帧的语义表达,形成特征序列,用不用的标签进行打标,随后在通过多层次的网络对这些不同打标的内容进行关系表达,深度理解这些内容之间的关联度,将相似的节点衔接起来,最终组合出对整个视频的理解。”

烹饪节目中包含各种内容,不同内容用不同演示边框表示,最终组合出对整个视频的理解

析策表示,一个视频包含帧、镜头、场景、事件等,帧与帧、镜头与镜头间的关系十分复杂,不仅仅是前后帧的顺序关系,而目前公开的建模方法一般都无法表达如此复杂的关系,DCGN因对复杂内容的深度学习和理解进而提升识别精度。

据悉,阿里安全图灵实验室已将AI能力在内容治理、知识产权、身份认证验证和新零售安防等领域进行运用,覆盖阿里生态的淘宝、支付宝、优酷、UC等核心业务线。

近期刷爆社交网络的网红“AI鉴黄师”,每天可审核数亿张图片,识别准确率高于99.5%,技术能力便来自阿里安全图灵实验室。连视频内容都能理解了,解读一张图片岂不是小菜一碟?

图片来源图虫:已授站长之家使用

举报

  • 相关推荐
  • 秒创:支持图文转视频AI数字人等功能

    一帧秒创是一款基于秒创AIGC引擎的智能AI内容生成平台,旨在为创作者和机构提供多种AI生成服务,包括文字续写、文字转语音、文生成图、图文转视频等多项创作服务。这个平台的核心特点是其智能分析技术,能够快速将文案、素材、AI语音和字幕等元素整合,创作出高质量的视频内容,无需复杂的编辑和制作过程。这些功能使一帧秒创成为一个全面的视频内容创作工具,为用户提供了从文字到视频的一站式解决方案,简化了视频制作过程,提高了创作效率。

  • 异军突起的视频AI,揭示了什么?

    悄然崛起的视频AI,标志着AI竞争进入了下一阶段。在当下的AI赛道上,AI聊天、绘画一类的应用,早已枝繁叶茂。要想摘掉这样的“低劣”标签,真正地让作品具有感情和灵魂,除了一个劲儿地“降本”之外,在个性化、拟真度,以及素材丰富性方面,国产视频AI还有很长的路要走。

  • AI视频生成框架AnimateDiff 高速运动视频依然保持稳定

    AnimateDiff是一款强大的工具,它允许您轻松地将文本转化为动画图像无需特定的调整。它为用户提供了无限的创意和探索空间,让您可以将文本描述转化为令人惊叹的动画场景。只需运行几个命令,就可以在本地主机上启动演示,通过用户友好的界面进行互动。

  • 一条视频获赞935万,短视频卷起了高

    9月抖音涨粉榜已出,我们一起来看榜:受花西子事件影响,国货品牌在9月迎来了声势浩大的翻红热潮。凭借着玩梗、发疯、整活、卖惨、产品促销等一系列“商战”手段,不少国货品牌借此迎来了粉丝量和销售额的双重增长。2023年只剩下了3个月时间,尾声阶段,是否会有涨粉黑马杀出重围?我们持续关注。

  • 一站式音视频生产协作平台“分秒” 提供在线审片批注等功能

    分秒帧是一站式音视频生产协作平台,提供从在线审片批注、意见收集到成片交付,以及素材和版本管理、项目流程管控等全方位功能。它旨在让整个团队实现更短的审改周期、更高的出片效率、更少的人力消耗,从全面提升内容生产力,助力企业和团队降本增效,有效把握内容交付质量,扩大业务规模。

  • Capsule:AI驱动的视频编辑利器

    Capsule是一个采用人工智能技术的视频编辑器,专为内容和营销团队设计。它可以帮助用户快速制作惊艳的视频,轻松协作,并保持品牌一致性。随着AI在内容制作领域的不断应用,像Capsule这样的工具必将深刻改变我们的内容生产方式。

  • Google AI推出SANPO:多属性视频数据集助力高视觉场景理解

    GoogleAI最近推出了名为SANPO的数据集,旨在帮助AI模型更好地理解户外人类主观场景。这一数据集的重要性在于,它不仅包括真实世界的数据包括合成数据,以及丰富的注释和多属性特征。研究人员的隐私承诺使这一数据集能够支持其他研究人员开发面向视障人士的视觉导航系统,并推动先进的视觉场景理解领域的发展。

  • 二孩家庭英语教育新突破:智慧引导,让每个孩子都独一无二

    随着社会的进步和科技的发展,教育方式和理念也在不断地更新和进步。在近期热播的第二届iEnglish英语风采秀总决选中,来自西安的刘紫宸和刘紫程两姐妹的精彩表现引起了广大观众的关注。通过这个节目,我们看到了许多家庭如何以智慧引导、个性化教育的方式,让孩子们在快乐中高效学习英语。

  • 清华芯片新突破登Science,获评“存算一体领域重大进展”!基于类脑架构实现片上快速AI学习

    清华最新芯片成果,登上Science!全球首颗全系统集成、支持高效片上学习的忆阻器存算一体芯片,正式问世。它集合了记忆、计算和学习能力。Science编辑表示,基于忆阻器的芯片技术近期受到非常大的关注,它有望克服冯诺依曼架构造成的算力瓶颈。

  • 新突破!华尔科技用工业4.0改造传统纺织服装业

    纺织业通常被视为传统的、劳动密集型的产业。近年来,由于逆全球化趋势,低端纺织生产逐渐离开中国,迁往劳动力更为廉价的东南亚国家。在中国重要转型期,如何将这些逐渐外流的产业留在国内,已经成为国家面临的首要战略问题。然而,华尔科技,一家浙江嘉兴的隐形行业巨头,却选择了一条与众不同的道路。华尔科技不仅坚守在中国,聚焦高端棉袜市场,还通过技�