首页 > 业界 > 关键词  > 正文

谷歌推出视频注释工具VidLNs 可生成丰富的视频描述

2023-08-09 14:30 · 稿源:站长之家

站长之家(ChinaZ.com)8月9日 消息:VidLNs 是谷歌推出的一种视频注释工具,可以生成丰富的视频描述,并实现准确的时空定位。这是一种注释视频的增强方法,通过同时使用语音描述和鼠标移动来构建视频的叙述。

VidLNs 的注释过程包括观察视频、选择关键帧、逐个角色构建叙述,并使用语音描述和鼠标移动来标记相关对象和动作。

image.png

项目地址:https://github.com/google/video-localized-narratives

通过选择关键帧来表示每个角色的重要时刻,并通过口述描述和鼠标指导来突出显示相关对象和动作。这种方法可以生成详细的视频注释,为视频叙事定位和视频问答等任务提供了坚实的基础。

核心功能:

1. 通过语音描述和鼠标移动来构建视频叙述。

2. 使用关键帧来突出显示每个角色的关键时刻。

3. 提供准确的时空定位,生成详细的视频注释。

4. 为视频叙事定位和视频问答等任务提供基础。

举报

  • 相关推荐
  • 大家在看

今日大家都在搜的词:

热文