无人机航拍数据集整理
本文整理了14个常用于计算机视觉任务(特别是目标检测)的无人机航拍与遥感图像数据集,涵盖城市监控、交通分析、地物识别等多个应用场景。
1. VisDrone
- 发布机构:天津大学AISKYEYE团队
- 简介:大规模无人机视角数据集,由400个视频片段(265,228帧)和10,209张静态图像组成。采集于中国14个不同城市,涵盖城乡多种环境。
- 关键信息:
- 图像/视频:265,228帧 + 10,209张图
- 标注数量:超过260万个边界框
- 目标类别:行人、汽车、自行车、三轮车等11类(含
others) - 属性:提供场景可见性、遮挡等属性标注
- 分辨率:多种,由不同无人机平台采集
- 用途:目标检测、跟踪
- 链接:VISDRONE官网
2. DOTA
- 发布机构:武汉大学
- 简介:用于航拍图像目标检测的大型数据集,图像来源于Google Earth、JL-1卫星、GF-2卫星等。
- 关键信息:
- 图像数量:2,806张
- 标注数量:188,282个实例
- 目标类别:15类(飞机、轮船、储罐、运动场、车辆、桥梁等)
- 标注格式:定向边界框(任意四边形)
- 图像尺寸:800×800 ~ 4000×4000像素
- 用途:遥感图像目标检测
- 链接:相关介绍
3. UCAS-AOD
- 发布机构:中国科学院大学
- 简介:专注于航拍图像中的两类目标检测。
- 关键信息:
- 目标类别:2类(汽车、飞机)
- 图像数量:约1,000张
- 特点:包含背景负样本
- 用途:车辆与飞机检测
- 链接:数据集下载
4. UAVDT
- 简介:用于无人机检测与跟踪的大规模基准数据集,关注车辆目标。
- 关键信息:
- 数据量:约80,000帧(选自10小时原始视频)
- 视频序列:100个
- 分辨率:1080×540
- 标注:边界框,含车辆类别和遮挡属性
- 场景:广场、主干道、收费站、高速公路等
- 用途:目标检测(DET)、单目标跟踪(SOT)、多目标跟踪(MOT)
- 链接:项目主页
5. UAV123
- 简介:从低空无人机捕获的视频跟踪数据集,侧重于长期空中跟踪。
- 关键信息:
- 视频序列:123个
- 总帧数:超过110K帧
- 子集:
- 专业无人机拍摄的稳定视频(103个序列)
- 消费级无人机拍摄的不稳定视频(12个序列)
- 游戏引擎渲染的合成视频(8个序列)
- 标注:完全手工标注
- 用途:单目标跟踪、长期跟踪
- 链接:相关博客
6. CARPK
- 简介:汽车停车场数据集,专注于车辆计数与定位。
- 关键信息:
- 数据来源:无人机在约40米高度拍摄的4个停车场
- 标注数量:近90,000辆汽车
- 标注格式:边界框(左上角、右下角点)
- 用途:车辆计数、目标检测
- 链接:Papers With Code
7. AU-AIR
- 简介:首个用于目标检测的多模态无人机数据集,集成了来自不同机载传感器的数据。
- 关键信息:
- 数据量:2小时原始视频,32,823个已标注帧
- 标注数量:132,034个对象实例
- 目标类别:8类(与交通监控相关)
- 用途:多模态目标检测
- 链接:相关介绍
8. ERA
- 简介:大型航拍视频数据集,用于事件识别。
- 关键信息:
- 视频数量:2,864个
- 视频规格:5秒,640×640大小
- 类别:25个不同的事件类别
- 用途:视频分析、事件识别
9. VEDAI
- 发布机构:卡昂大学(2015年)
- 简介:车辆检测遥感数据集。
- 关键信息:
- 图像数量:1,210张
- 图像尺寸:512×512 / 1024×1024(4波段:RGB+NIR)
- 分辨率:0.125米
- 标注数量:3,640个目标
- 目标类别:9类(飞机、船、各种车辆等)
- 标注格式:定向边界框(OBB)
- 用途:遥感车辆检测
- 链接:官网
10. ITCVD
- 发布机构:特文特大学(2018年)
- 简介:专注于车辆检测的航拍影像数据集。
- 关键信息:
- 图像数量:135张
- 图像尺寸:5616×3744
- 分辨率:0.1米
- 标注数量:23,543个目标
- 目标类别:1类(车辆)
- 标注格式:水平边界框(HBB)
- 用途:车辆检测
- 链接:研究信息页
11. DLR3k Vehicle
- 简介:使用DLR 3K摄像机系统在德国慕尼黑地区拍摄的车辆检测数据集。
- 关键信息:
- 图像数量:20张
- 图像尺寸:5616×3744
- 分辨率:13厘米
- 标注数量:14,235辆车
- 标注格式:定向边界框(给出中心点、宽、长及与x轴夹角)
- 用途:高分辨率车辆检测
12. OIRDS
- 发布机构:雷神公司等(2009年)
- 简介:用于遥感目标检测的研究数据集。
- 关键信息:
- 图像数量:900张
- 图像尺寸:256×256 ~ 640×640
- 分辨率:约0.15米
- 标注数量:1,800个目标
- 目标类别:5类(各种车辆)
- 标注格式:定向边界框(OBB)
- 用途:遥感目标检测
- 链接:SourceForge
13. NWPU-RESISC45
- 发布机构:西北工业大学
- 简介:遥感图像场景分类基准数据集。
- 关键信息:
- 图像数量:31,500张
- 图像尺寸:256×256
- 场景类别:45类(机场、海滩、森林、农田、城市区域等)
- 每类数量:700张
- 用途:场景分类(非目标检测)
- 链接:超神经
14. DIOR
- 发布机构:西北工业大学
- 简介:大规模光学遥感图像目标检测数据集。
- 关键信息:
- 图像数量:23,463张
- 图像尺寸:800×800
- 分辨率:0.5米 ~ 30米
- 标注数量:190,288个实例
- 目标类别:20类(涵盖车辆、建筑、设施等)
- 特点:包含不同季节、天气条件,具有位置多样性
- 用途:遥感图像目标检测
- 链接:相关博客
总结与选择建议
| 数据集 | 主要特点 | 适用任务 | 标注格式 |
|---|---|---|---|
| VisDrone | 规模最大、场景丰富、属性全 | 检测、跟踪 | HBB |
| DOTA | 类别多、采用定向框、遥感来源 | 遥感检测 | OBB |
| UAVDT | 纯车辆、侧重跟踪 | 检测、跟踪 | HBB |
| VEDAI | 多波段、车辆类别细 | 车辆检测 | OBB |
| DIOR | 类别均衡、场景多样 | 遥感检测 | HBB |
| NWPU | 场景分类数据集 | 图像分类 | 图像级标签 |
提示:
- HBB: Horizontal Bounding Box (水平边界框)
- OBB: Oriented Bounding Box (定向边界框),更适合遥感中旋转的物体。
- 根据任务(检测/跟踪/分类)、目标类别(通用/车辆/特定)和标注需求(HBB/OBB)选择合适的数据集。