阿里AI视频识别算法新突破：可帧级解读视频

2018-09-14 11:26 · 稿源：快科技

手机里存了大量的视频，想剪辑其中的精彩片段却犹如大海捞针?视频网站拥有海量视频，如何严格审核避免问题发生?

近日，在德国慕尼黑举办的计算机视觉国际顶会ECCV(European Conference on Computer Vision)上，阿里安全图灵实验室高级算法专家析策展示了最新的AI视频识别算法，其识别精度超越目前主流方法，有效提升了视频自动标签的行业精度，这一新算法已被ECCV收录。

阿里安全图灵实验室高级算法专家析策表示，为提升AI技术在实际场景中针对视频识别的精度，提出一种新的基于图(Graph)的视频建模方法，能表达含有复杂事件内容的长视频。

析策表示，这一方法的主要思路是通过“深度卷积图神经网络”(下称“DCGN”)对视频的帧、镜头、事件进行多级的建模，逐渐地从帧级、镜头级，一直到视频级进行抽象，从而获得视频全局的表达，进而进行分类。

他举例称，“比如一段美食节目视频中，包含厨师长、主持人聊天、食物、观众等内容，AI在学习视频内容时会先根据内容对视频进行逐帧的语义表达，形成特征序列，用不用的标签进行打标，随后在通过多层次的网络对这些不同打标的内容进行关系表达，深度理解这些内容之间的关联度，将相似的节点衔接起来，最终组合出对整个视频的理解。”

烹饪节目中包含各种内容，不同内容用不同演示边框表示，最终组合出对整个视频的理解

析策表示，一个视频包含帧、镜头、场景、事件等，帧与帧、镜头与镜头间的关系十分复杂，不仅仅是前后帧的顺序关系，而目前公开的建模方法一般都无法表达如此复杂的关系，DCGN因对复杂内容的深度学习和理解进而提升识别精度。

据悉，阿里安全图灵实验室已将AI能力在内容治理、知识产权、身份认证验证和新零售安防等领域进行运用，覆盖阿里生态的淘宝、支付宝、优酷、UC等核心业务线。

近期刷爆社交网络的网红“AI鉴黄师”，每天可审核数亿张图片，识别准确率高于99.5%，技术能力便来自阿里安全图灵实验室。连视频内容都能理解了，解读一张图片岂不是小菜一碟?

图片来源图虫：已授站长之家使用

（举报）

阿里AI视频识别算法新突破：可帧级解读视频

一帧秒创：支持图文转视频，AI数字人等功能

荐异军突起的视频AI，揭示了什么？

荐AI视频生成框架AnimateDiff 高速运动视频依然保持稳定

荐一条视频获赞935万，短视频卷起了高级感

一站式音视频生产协作平台“分秒帧” 提供在线审片批注等功能

Capsule：AI驱动的视频编辑利器

Google AI推出SANPO:多属性视频数据集助力高级视觉场景理解

二孩家庭英语教育新突破：智慧引导，让每个孩子都独一无二

荐清华芯片新突破登Science，获评“存算一体领域重大进展”！基于类脑架构实现片上快速AI学习

创新突破！华尔科技用工业4.0改造传统纺织服装业

热文

理想小米同一个地方开发布会：理想i8发布会定于首都国际会议中

贾跃亭旗下FF获1.05亿美元融资将加速FX Super One生产交付

华为鸿蒙智行：尊界S800上市50天大定破8000台

理想i8开启预定：7月29日上市预售价35-40万元

华为MatePad Pro 12.2开启预约预计7月24日正式发布

A日报：Kimi开放平台上线Kimi Playground；OpenAI重磅发布Chat

小米深圳大厦开园：卢伟冰现场喝小米粥

小米骨传导耳机2发布：699元 7月21日开售

尾号“8个7”手机号拍出320万元溢价率高达146%

AI日报：美图发布影像AI Agent RoboNeo；1.8bit量化Kimi K2模型

A日报：月之暗面开源大模型Kimi K2；智源全面开源RoboBrain2.0

淘宝闪购：日订单量再次突破8000万创新高

王化在小米履职10年雷军：谢谢这十年辛苦的工作和贡献

黄仁勋与雷军合影上热搜一旁小米SU7 Ultra见证科技双雄会

理想小米同一个地方开发布会：理想i8发布会定于首都国际会议中

黄仁勋称想买一辆小米汽车英伟达在多方面与小米开展合作

抖音：“抖音会议”App是诈骗软件会直接控制用户手机

贾跃亭旗下FF获1.05亿美元融资将加速FX Super One生产交付

站长商机