分类 AI科学下的文章

针对长尾分布的Eql损失

作者: 孔西皮
时间: 2023-03-03
分类: AI科学
评论

论文: The Equalization Losses: Gradient-Driven Training for Long-tailed Object Recognition

代码：

https://github.com/ModelTC/United-Perception
(已集成到 mmdetection) https://github.com/tztztztztz/eqlv2

解决长尾分布问题直观的做法有两类：设计数据重采样策略，或者对损失重加权（为不同类别或实例分配不同的权重）。大多数现有方法都是基于类别的频率设计的，然而这有个缺陷：这些方法不够鲁棒，因为广泛存在着容易的负样本和冗余的正样本。并且数据重采样还会增加训练时长。而本篇工作使用累积正负梯度比作为指标。它更稳定、更精确，能更好地反映模型的训练状态，对于长尾类别，正负梯度比接近0，而对于非长尾类别，正负梯度比接近1。本文根据当前的累积梯度动态地重新平衡正/负梯度，并以实现平衡梯度比为统一目标。基于此思想，论文得到了BCE loss、CE loss、Focal loss的均衡损失（Equalization loss）版本。

在本篇论文之前，论文作者已经在CVPR2020 《Equalization loss for long-tailed object recognition》和 CVPR2021 《Equalization Loss v2: A New Gradient Balance Approach for Long-tailed Object Detection》发表了部分观点，而本篇论文像是对以往工作的大一统总结和扩展。

- 阅读剩余部分 -

AAAI 2023实用AI挑战赛冠军方案分享

作者: 孔西皮
时间: 2023-02-28
分类: AI科学
1 条评论

2023年1月，AAAI 2023 实用AI挑战赛落下帷幕。我所在的team_kppkkp队获得总榜冠军。在此，分享一下我们队本次比赛的方案，抛砖引玉。

本次比赛由商汤科技联合北航刘祥龙教授团队，携手安徽合肥数据空间研究院、天数智芯、科大讯飞、OpenI 启智新一代人工智能开源开放平台等机构与企业，在国际顶级人工智能会议AAAI 2023上举办，旨在搭建一座连通学术与工业化落地的桥梁，筛选出效果好、效率高、鲁棒性强的模型设计，推动人工智能领域朝实用方向发展。

- 阅读剩余部分 -

VAE介绍

作者: 孔西皮
时间: 2022-11-08
分类: AI科学
评论

VAE，即变分自编码器，是常见的生成模型其中一类。常见的生成模型类型还有GAN、flow、DDPM等。

- 阅读剩余部分 -

多目标跟踪-UAVMOT-CVPR2022

作者: 孔西皮
时间: 2022-07-11
分类: AI科学
评论

论文：Multi-Object Tracking Meets Moving UAV（CVPR2022）

代码：https://github.com/LiuShuaiyr/UAVMOT

- 阅读剩余部分 -

多目标跟踪-OCSORT-CVPR2022

作者: 孔西皮
时间: 2022-07-04
分类: AI科学
评论

论文：Observation-Centric SORT: Rethinking SORT for Robust Multi-Object Tracking（CVPR2022）

代码：https://github.com/noahcao/OC_SORT

- 阅读剩余部分 -

多目标跟踪-FairMOT-IJCV2021

作者: 孔西皮
时间: 2022-05-23
分类: AI科学
评论

直接将ReID头加入检测网络会造成跟踪性能大的下降，从而造成过多IDSW。本文探究了失败的原因，并提出了一种简单有效的解决方案。

论文：FairMOT: On the Fairness of Detection and Re-Identiﬁcation in Multiple Object Tracking

代码： https://github.com/ifzhang/FairMOT

- 阅读剩余部分 -

卡尔曼滤波器

作者: 孔西皮
时间: 2022-04-06
分类: AI科学
评论

我们观测到的数据总是包含噪声的，为了得到更准确的结果，卡尔曼最早在1960年提出卡尔曼滤波器，Kalman Filter 的目的是利用先验知识，根据一批采样数据$(X_1, X2, ...,X_n)$估计对象在n时刻的状态$Z_n$。例如我们在跟踪飞行器的时候，我们对它的运动状态并非一无所知，我们知道很多牛顿力学、运动学知识可以帮助我们做出判断。

- 阅读剩余部分 -