阅读背景：

论文解读：SlowFast Networks for Video Recognition

发表于:2025-10-11

一. 摘要

本文提出了用于视频识别的 SlowFast 网络。该模型包含：1）一个以低帧率运行、用来捕捉空间语义的 Slow 路径；2）一个以高帧率运行、以较好的时间分辨率来捕捉运动的 Fast 路径。我们可以减少 Fast 路径的通道容量，使其变得非常轻，但依然可以学习有用的时间信息用于视频识别。我们的模型在视频动作分类及检测方面性能强大，而且我们的 SlowFast 概念实现的巨大改进是对这一领域的重要贡献。我们在没有使用任何预训练的情况下在 Kinetics 数据集上实现了 79.0% 的准确率，远远超过此类问题的之前最佳水平。在 AVA 动作检测数据集上，我们实现了 28.3 mAP 的当前最佳水准。本文提出了用于视频识别的 SlowFast 网络。该模型包含：1）一个以低帧率运行、用

分享到：

非常感谢你花费了来阅读本文,如果你在本站获取到了新知识,那就请点击分享按钮将本站分享出去吧。

你可能喜欢:

boost 序列化多个条数据，文件读取

推荐近期阅读过的几本书

举例讲解Node.js中的Writable对象

基于遗传算法(GA)的神经网络训练算法

Spring 获取 WebApplicationContext 常用方法

二、使用Shiro注解

小型企业的上网行为管理方案

撤销git的错误提交(git add ， git commit， git push)

【js基础】原生js实现模态弹窗效果

在R [duplicate]中查找向量中最常见的元素