视觉与无人机:图像目标检测挑战赛(VisDrone2019-DET)
VisDrone2019-DET 数据集是一个大规模的无人机图像目标检测基准,由中国天津大学机器学习与数据挖掘实验室的AISKYEYE团队创建。它包含了经过精心标注的真值数据,适用于各种基于无人机图像和视频分析的计算机视觉任务。
该基准中的图像和视频序列是在中国14个不同城市的各类城市/郊区区域(从北到南)使用多种消费级无人机(如大疆御系列、精灵系列等)在不同场景下拍摄的,涵盖:
| 子集 | 图像数量 | 标注情况 | 描述 |
|---|---|---|---|
| 训练集(Train) | 6,471 | ✅ 6,471 | 带有完整标注的训练集 |
| 验证集(Val) | 548 | ✅ 548 | 带有标注的验证集 |
| 测试开发集(Test-dev) | 1,610 | ✅ 1,610 | 测试开发集 |
| 挑战测试集(Test-challenge) | 1,580 | ❌ 无 | 挑战测试集(无公开标签) |
| 总计(Total) | 10,209 | 8,629 |
| ID | 类别(Category) | ID | 类别(Category) |
|---|---|---|---|
| 0 | ignored | 5 | van |
| 1 | pedestrian | 6 | truck |
| 2 | people | 7 | tricycle |
| 3 | bicycle | 8 | awning-tricycle |
| 4 | car | 9 | bus |
| 10 | motor | ||
| 11 | others |
每个标注文件(.txt)的每一行包含一个目标,由 8 个逗号分隔的字段组成:
<bbox_left>,<bbox_top>,<bbox_width>,<bbox_height>,<score>,<category>,<truncation>,<occlusion>| 字段 | 描述 |
|---|---|
| bbox_left | 左上角 X 坐标 |
| bbox_top | 左上角 Y 坐标 |
| bbox_width | 边界框宽度 |
| bbox_height | 边界框高度 |
| score | 0:忽略,1:有效 |
| category | 对象类别 ID(0-11) |
| truncation | 0:未截断,1:已截断 |
| occlusion | 0:无遮挡,1:部分遮挡,2:严重遮挡,3:未知 |
VisDrone2019-DET/
├── train/
│ ├── images/ (6,471 .jpg files)
│ └── annotations/ (6,471 .txt files)
├── val/
│ ├── images/ (548 .jpg files)
│ └── annotations/ (548 .txt files)
├── test-dev/
│ ├── images/ (1,610 .jpg files)
│ └── annotations/ (1,610 .txt files)
└── test-challenge/
└── images/ (1,580 .jpg files, no annotations)如果您在研究中使用此数据集,请引用以下论文:
@article{zhu2021visdrone,
title={The VisDrone Dataset: A Large-scale Benchmark for Object Detection in Drone Imagery},
author={Zhu, Pengfei and Wen, Longyin and Du, Dawei and Bian, Xiao and Fan, Heng and Hu, Qinghua and Ling, Haibin},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
year={2021}
}
@inproceedings{zhu2019visdrone,
title={VisDrone: The Vision Meets Drone Object Detection in Image Challenge},
author={Zhu, Pengfei and Wen, Longyin and Du, Dawei and Bian, Xiao and Hu, Qinghua and Ling, Haibin},
booktitle={Proceedings of the IEEE/CVF International Conference on Computer Vision Workshops (ICCVW)},
year={2019}
}本仓库是 VisDrone2019-DET 数据集的镜像,旨在为中国用户提供便捷的访问途径。
Gewis 实验室 — 天津商业大学 理学院
感谢原始的VisDrone 团队(天津大学机器学习与数据挖掘实验室 AISKYEYE)创建并维护了这个出色的基准数据集。
同时感谢AtomGit(atomgit.com)提供仓库托管平台和 Git LFS 支持,使大规模数据集的高效分发成为可能。
注意:数据集的所有权利归原作者所有。本镜像为非官方版本,仅用于研究目的。