无人机航拍数据集整理

本文整理了14个常用于计算机视觉任务(特别是目标检测)的无人机航拍与遥感图像数据集,涵盖城市监控、交通分析、地物识别等多个应用场景。

1. VisDrone

  • 发布机构:天津大学AISKYEYE团队
  • 简介:大规模无人机视角数据集,由400个视频片段(265,228帧)和10,209张静态图像组成。采集于中国14个不同城市,涵盖城乡多种环境。
  • 关键信息
    • 图像/视频:265,228帧 + 10,209张图
    • 标注数量:超过260万个边界框
    • 目标类别:行人、汽车、自行车、三轮车等11类(含others
    • 属性:提供场景可见性、遮挡等属性标注
    • 分辨率:多种,由不同无人机平台采集
  • 用途:目标检测、跟踪
  • 链接VISDRONE官网

2. DOTA

  • 发布机构:武汉大学
  • 简介:用于航拍图像目标检测的大型数据集,图像来源于Google Earth、JL-1卫星、GF-2卫星等。
  • 关键信息
    • 图像数量:2,806张
    • 标注数量:188,282个实例
    • 目标类别:15类(飞机、轮船、储罐、运动场、车辆、桥梁等)
    • 标注格式定向边界框(任意四边形)
    • 图像尺寸:800×800 ~ 4000×4000像素
  • 用途:遥感图像目标检测
  • 链接相关介绍

3. UCAS-AOD

  • 发布机构:中国科学院大学
  • 简介:专注于航拍图像中的两类目标检测。
  • 关键信息
    • 目标类别:2类(汽车、飞机)
    • 图像数量:约1,000张
    • 特点:包含背景负样本
  • 用途:车辆与飞机检测
  • 链接数据集下载

4. UAVDT

  • 简介:用于无人机检测与跟踪的大规模基准数据集,关注车辆目标。
  • 关键信息
    • 数据量:约80,000帧(选自10小时原始视频)
    • 视频序列:100个
    • 分辨率:1080×540
    • 标注:边界框,含车辆类别和遮挡属性
    • 场景:广场、主干道、收费站、高速公路等
  • 用途:目标检测(DET)、单目标跟踪(SOT)、多目标跟踪(MOT)
  • 链接项目主页

5. UAV123

  • 简介:从低空无人机捕获的视频跟踪数据集,侧重于长期空中跟踪。
  • 关键信息
    • 视频序列:123个
    • 总帧数:超过110K帧
    • 子集
      1. 专业无人机拍摄的稳定视频(103个序列)
      2. 消费级无人机拍摄的不稳定视频(12个序列)
      3. 游戏引擎渲染的合成视频(8个序列)
    • 标注:完全手工标注
  • 用途:单目标跟踪、长期跟踪
  • 链接相关博客

6. CARPK

  • 简介:汽车停车场数据集,专注于车辆计数与定位。
  • 关键信息
    • 数据来源:无人机在约40米高度拍摄的4个停车场
    • 标注数量:近90,000辆汽车
    • 标注格式:边界框(左上角、右下角点)
  • 用途:车辆计数、目标检测
  • 链接Papers With Code

7. AU-AIR

  • 简介:首个用于目标检测的多模态无人机数据集,集成了来自不同机载传感器的数据。
  • 关键信息
    • 数据量:2小时原始视频,32,823个已标注帧
    • 标注数量:132,034个对象实例
    • 目标类别:8类(与交通监控相关)
  • 用途:多模态目标检测
  • 链接相关介绍

8. ERA

  • 简介:大型航拍视频数据集,用于事件识别。
  • 关键信息
    • 视频数量:2,864个
    • 视频规格:5秒,640×640大小
    • 类别:25个不同的事件类别
  • 用途:视频分析、事件识别

9. VEDAI

  • 发布机构:卡昂大学(2015年)
  • 简介:车辆检测遥感数据集。
  • 关键信息
    • 图像数量:1,210张
    • 图像尺寸:512×512 / 1024×1024(4波段:RGB+NIR)
    • 分辨率:0.125米
    • 标注数量:3,640个目标
    • 目标类别:9类(飞机、船、各种车辆等)
    • 标注格式定向边界框(OBB)
  • 用途:遥感车辆检测
  • 链接官网

10. ITCVD

  • 发布机构:特文特大学(2018年)
  • 简介:专注于车辆检测的航拍影像数据集。
  • 关键信息
    • 图像数量:135张
    • 图像尺寸:5616×3744
    • 分辨率:0.1米
    • 标注数量:23,543个目标
    • 目标类别:1类(车辆)
    • 标注格式:水平边界框(HBB)
  • 用途:车辆检测
  • 链接研究信息页

11. DLR3k Vehicle

  • 简介:使用DLR 3K摄像机系统在德国慕尼黑地区拍摄的车辆检测数据集。
  • 关键信息
    • 图像数量:20张
    • 图像尺寸:5616×3744
    • 分辨率:13厘米
    • 标注数量:14,235辆车
    • 标注格式定向边界框(给出中心点、宽、长及与x轴夹角)
  • 用途:高分辨率车辆检测

12. OIRDS

  • 发布机构:雷神公司等(2009年)
  • 简介:用于遥感目标检测的研究数据集。
  • 关键信息
    • 图像数量:900张
    • 图像尺寸:256×256 ~ 640×640
    • 分辨率:约0.15米
    • 标注数量:1,800个目标
    • 目标类别:5类(各种车辆)
    • 标注格式定向边界框(OBB)
  • 用途:遥感目标检测
  • 链接SourceForge

13. NWPU-RESISC45

  • 发布机构:西北工业大学
  • 简介:遥感图像场景分类基准数据集。
  • 关键信息
    • 图像数量:31,500张
    • 图像尺寸:256×256
    • 场景类别:45类(机场、海滩、森林、农田、城市区域等)
    • 每类数量:700张
  • 用途场景分类(非目标检测)
  • 链接超神经

14. DIOR

  • 发布机构:西北工业大学
  • 简介:大规模光学遥感图像目标检测数据集。
  • 关键信息
    • 图像数量:23,463张
    • 图像尺寸:800×800
    • 分辨率:0.5米 ~ 30米
    • 标注数量:190,288个实例
    • 目标类别:20类(涵盖车辆、建筑、设施等)
    • 特点:包含不同季节、天气条件,具有位置多样性
  • 用途:遥感图像目标检测
  • 链接相关博客

总结与选择建议

数据集 主要特点 适用任务 标注格式
VisDrone 规模最大、场景丰富、属性全 检测、跟踪 HBB
DOTA 类别多、采用定向框、遥感来源 遥感检测 OBB
UAVDT 纯车辆、侧重跟踪 检测、跟踪 HBB
VEDAI 多波段、车辆类别细 车辆检测 OBB
DIOR 类别均衡、场景多样 遥感检测 HBB
NWPU 场景分类数据集 图像分类 图像级标签

提示

  • HBB: Horizontal Bounding Box (水平边界框)
  • OBB: Oriented Bounding Box (定向边界框),更适合遥感中旋转的物体。
  • 根据任务(检测/跟踪/分类)、目标类别(通用/车辆/特定)和标注需求(HBB/OBB)选择合适的数据集。