VideoMAE:简单高效的视频自监督预训练新范式|NeurIPS 2022
新智元报道
新智元报道
【新智元导读】本文将介绍南大、腾讯和上海人工智能实验室被NeurIPS 2022收录的工作。
1. 背景介绍
2. 研究动机
3. 方法介绍
4. VideoMAE实现细节
5. 消融实验
6. VideoMAE的重要特性
7. 主要结果
8. 对社区的影响
9. 总结
背景介绍
研究动机
方法介绍
MAE概述
视频数据的特性
与图像数据相比,视频数据包含了更多的帧,也具有更加丰富的运动信息。本节会先分析一下视频数据的特性。
对视频数据不同掩码策略的示例
时序相关性
VideoMAE方法介绍
时空块嵌入
VideoMAE实现细节
消融实验
解码器设计
掩码策略
重建目标
预训练策略
预训练数据集
预训练轮次
VideoMAE的重要特性
VideoMAE是一种数据高效的学习器
极高的掩码率
泛化和迁移能力:数据的质量与数量
主要结果
对社区的影响
总结
参考资料:
微信扫码关注该文公众号作者
戳这里提交新闻线索和高质量文章给我们。
来源: qq
点击查看作者最近其他文章