澳洲门户网 首页 热点资讯 查看内容

当CV碰上无人机:ICCV 2019 VisDrone冠军方案解读

2023-6-7 17:14| 发布者: 摄影数码| 查看: 1381| 评论: 0

文章来源:搜狐无人机


来源:机器之心 作者:罗志鹏


近日,在 ICCV 2019 Workshop 举办的 Vision Meets Drone: A Challenge(简称:VisDrone2019) 挑战赛公布了最终结果,来自深兰科技北京 AI 研发中心的 DeepBlueAI 团队斩获了「视频目标检测」和「多目标追踪」两项冠军。我们可以通过这篇文章来了解一下 DeepBlueAI 团队的解决方案。


The VisDrone2019 挑战赛


如今,配备摄像头的无人机或通用无人机已经广泛地应用在农业、航空摄影、快速交付、监视等多个领域。


VisDrone2019 数据集由天津大学机器学习与数据挖掘实验室 AISKYEYE 队伍负责收集,全部基准数据集由无人机捕获,包括 288 个视频片段,总共包括 261908 帧和 10209 个静态图像。


这些帧由 260 多万个常用目标(如行人、汽车、自行车和三轮车)的手动标注框组成。为了让参赛队伍能够更有效地利用数据,数据集还提供了场景可见性、对象类别和遮挡等重要属性。


本届挑战赛包含四个任务:


  • 任务 1:图像中的目标检测。任务旨在从无人机拍摄的单个图像中检测预定义类别的对象(例如,汽车和行人);
  • 任务 2:视频中的目标检测。该任务与任务 1 相似,不同之处在于需要从视频中检测对象;
  • 任务 3:单目标跟踪挑战。任务旨在估计后续视频帧中第一个帧中指示的目标状态;
  • 任务 4:多目标跟踪挑战。该任务旨在恢复每个视频帧中对象的轨迹。

这次比赛的难点主要有:


1. 大量的检测物体


与常规检测数据集不同的是,每张图片包含上百个待检测物体,数据集总共含有 260 万个标注框,如果使用占用显存较大的模型,可能会出现资源不够的情况。同时面对一些重叠的结果时,我们需要选择合适的阈值去过滤出最好的结果。


2. 部分目标过小


因为数据集是由无人机拍摄而来,行人和远景的物体的标注框就非常小,这对模型产生 anchor 的能力形成了一定的挑战,高分辨率的空间信息和高质量的 proposal 在本次赛题中就显得尤为重要。


3. 不同的数据分布


常用的数据集如:COCO 数据集、OBJ365 都是广泛应用的数据集,所以大家经常用它们的预训练来 fine-tune 其他数据集。而这一次的数据集由于拍摄角度问题,预训练所带来的效果不如预期。



文章来源:搜狐无人机

转载声明:
本文为转载发布,仅代表原作者或原平台观点或立场,不代表我方观点。亚太菁英传媒及旗下澳洲门户网(ozportal.tv)仅提供信息发布平台,文章或有适当删改。对转载有异议和删稿要求的原著方,可联络info@ozportal.tv。

鲜花

握手

雷人

路过

鸡蛋

最新评论

扫码关注微信公众号

扫码下载澳洲门户APP

© 澳洲门户网 版权所有

返回顶部