多目标跟踪-FairMOT-IJCV2021
直接将ReID头加入检测网络会造成跟踪性能大的下降,从而造成过多IDSW。本文探究了失败的原因,并提出了一种简单有效的解决方案。
论文:FairMOT: On the Fairness of Detection and Re-Identification in Multiple Object Tracking
直接将ReID头加入检测网络会造成跟踪性能大的下降,从而造成过多IDSW。本文探究了失败的原因,并提出了一种简单有效的解决方案。
论文:FairMOT: On the Fairness of Detection and Re-Identification in Multiple Object Tracking
我们观测到的数据总是包含噪声的,为了得到更准确的结果,卡尔曼最早在1960年提出卡尔曼滤波器,Kalman Filter 的目的是利用先验知识,根据一批采样数据$(X_1, X2, ...,X_n)$估计对象在n时刻的状态$Z_n$。例如我们在跟踪飞行器的时候,我们对它的运动状态并非一无所知,我们知道很多牛顿力学、运动学知识可以帮助我们做出判断。
论文:Towards Rotation Invariance in Object Detection——ICCV2021
PolarMask是一种基于FCOS的,单阶段的实例分割框架。它首次证明了实例分割的复杂性,无论是网络设计还是计算复杂度,都可以和bbox目标检测相同,并且具有不错的准确性。
论文:PolarMask: Single Shot Instance Segmentation with Polar Representation
在FPN检测算法中,目标实例根据公式$k=\lfloor k_0+\log_2(\sqrt{wh}/224) \rfloor$分配到对应的level中。但是用于训练的每个实例分配到的特征级别可能不是最佳的。
本文的动机是让每个实例自由选择最佳的特征级别来优化网络。在训练过程中,根据实例内容(而不只是实例框的大小)为每个实例动态选择最合适的特征级别。
论文:Feature Selective Anchor-Free Module for Single-Shot Object Detection
代码:https://github.com/zccstig/mmdetection/tree/fsaf
用GCN做视频的零样本动作识别
论文:I Know the Relationships: Zero-Shot Action Recognition via Two-Stream Graph Convolutional Networks and Knowledge Graphs
代码:https://github.com/junyuGao/Zero-Shot-Action-Recognition-with-Two-Stream-GCN
论文:SketchGCN: Semantic Sketch Segmentation with Graph Convolutional Networks
代码:暂未开放源代码
这篇文章首次使用GCN进行手绘草图的语义分割任务,如下图中,将手绘的螃蟹的眼睛、钳子、身体、腿用不同的颜色标注。下图是SketchGCN的网络结构图。
这篇文章是我入门目标检测接触的第一篇论文,也是我本科毕设的baseline,因此文章中可能有很多看起来很幼稚的问题,感谢师兄当时的耐心!
(红色字为问题,绿色框为批注答疑,高亮为当时没理解清楚以后需留意补充的内容。)
论文:FCOS: Fully Convolutional One-Stage Object Detection
代码:https://github.com/tianzhi0549/FCOS