机器学习需要的大量数据集从哪里找?-程序员宅基地

1.医学图像

疟疾细胞

图像数据集

皮肤癌 MNIST：HAM10000

下载链接：http://suo.nz/33n6Xy该数据集收集了来自不同人群的皮肤镜

图像，通过不同的方式获取和存储。最终数据集包含 10015 张皮肤镜图像，可用作学术机器学习目的的训练集。案例包括色素病变领域所有重要诊断类别的代表性集合：光化性角化病和上皮内癌/鲍温氏病 (akiec)、基底细胞癌 (bcc)，超过50%的病变是通过组织病理学（histo）证实的，其余病例的ground truth要么是后续检查（follow_up），要么是专家共识（consensus），要么是活体共聚焦显微镜

（confocal）证实. 数据集包括具有多个图像的病变，可以通过 HAM10000_metadata 文件中的 lesion_id 列进行跟踪。

乳房组织病理学图像

下载链接：http://suo.nz/347Jt1 原始数据

集包含以 40 倍扫描的 162 个完整的乳腺癌 (BCa) 标本幻灯片图像。从中提取了 277,524 个大小为 50 x 50 的补丁（198,738 个 IDC 负值和 78,786 个 IDC 正值）。每个补丁的文件名格式为：u_xX_yY_classC.png — > example 10253_idx5_x1351_y1101_class0.png。其中 u 是患者 ID (10253_idx5)，X 是裁剪此补丁的 x 坐标，Y 是裁剪此补丁的 y 坐标，C 表示类，其中 0 是非 IDC 和1 是数据中心

。

胸部 X 光图像（肺炎）

下载链接：http://suo.nz/3aXYPg数据集分为 3 个文件夹（train、test、val）并包含每个图像类别（肺炎/正常）的子文件夹

。有 5,863 张 X 射线图像 (JPEG) 和 2 个类别（肺炎/正常）。胸部 X 光图像（前后位）选自广州市妇女儿童医疗中心

1 至 5 岁儿科患者的回顾性队列。

白内障数据集

下载链接：http://suo.nz/2cOidH用于白内障检测的白内障和正常眼睛图像数据集。

恶性与良性皮肤癌

下载链接：http://suo.nz/2kkvio该数据集包含良性皮肤痣和恶性皮肤痣图像的平衡数据集。数据由两个文件夹组成，每个文件夹包含两种痣的 1800 张图片 (224x244)。

CT 医学图像

下载链接：http://suo.nz/2tQehH该数据集旨在允许测试不同的方法来检查与使用对比度和患者年龄相关的 CT 图像数据的趋势。基本思想是识别与这些特征密切相关的图像纹理、统计模式和特征，并可能构建简单的工具，在这些图像被错误分类时自动对其进行分类（或查找可能是可疑情况、错误测量或校准不良机器的异常值）

MedMNIST医学图像分割

评估

下载链接：http://suo.nz/2BmrmoMedMNIST，这是 10 个预处理的医学开放数据集的集合。MedMNIST 经过标准化处理，可在轻量级 28x28 图像上执行分类任务，无需背景知识。它涵盖了医学图像分析

中的主要数据模式，在数据规模（从 100 到 100,000）和任务（二元/多类、序数回归和多标签）上具有多样性。MedMNIST 可用于教育目的、快速原型

设计、多模式机器学习或医学图像分析中的 AutoML。此外，MedMNIST Classification Decathlon 旨在对所有 10 个数据集上的 AutoML 算法进行基准测试

多标签视网膜疾病 (MuReD) 数据集

下载链接：http://suo.nz/2ISEr5多标签视网膜疾病（MuReD）数据集，使用从三个不同的最先进来源（即 ARIA、STARE 和 RFMiD 数据集）收集的图像，并执行一系列后处理确保图像质量的处理步骤、要分类的广泛疾病以及每个疾病标签有足够数量的样本。MuReD 数据集

由 2208 张图像组成，具有 20 个不同的标签，图像质量和分辨率各不相同。同时，确保数据的最低质量，每个标签有足够数量的样本。

2.语义分割

高分二号 (GF-2) 卫星图像大型土地覆盖数据集

数据集下载地址：http://suo.nz/2dPkdvGID 是具有高分二号 (GF-2) 卫星图像的大型土地覆盖数据集。这个新的数据集被命名为高分影像数据集

（GID），由于其覆盖面大、分布广、空间分辨率高等特点，与现有的土地覆盖数据集相比具有优势。GID 由两部分组成：大规模分类集

和精细土地覆盖分类集。大规模分类集包含 150 个像素级带注释的 GF-2 图像，精细分类集由 30,000 个多尺度图像块加上 10 个像素级带注释的 GF-2 图像组成。分别基于 5 个类别的训练图像和验证图像收集并重新标记 15 个类别的训练数据和验证数据。

DADA-seg

数据集下载地址：http://suo.nz/3bZ3qmDADA-seg 是一个按像素标注的事故数据集，其中包含交通事故的各种关键场景。

Dark Zurich

数据集下载地址：http://suo.nz/34sQlFDark Zurich 是一个图像数据集，包含在夜间、黄昏和白天拍摄的总共 8779 张图像，以及每张图像的相机各自的 GPS 坐标。这些 GPS 注释用于构建一天中的跨时间对应关系，即，将每个夜间或黎明图像与其白天对应物相匹配。

斯坦福背景数据集

数据集下载地址：http://suo.nz/2WWDgY斯坦福背景数据集是 Gould 等人引入的新数据集。(ICCV 2009)用于评估几何和语义场景理解的方法。该数据集包含 715 张图像，这些图像选自现有的公共数据集：LabelMe 、 MSRC、 PASCAL VOC 和Geometric Context。我们的选择标准是图像是户外场景，像素大约为 320 x 240，至少包含一个前景物体，并且地平线

位于图像内（不需要可见）。

CIHP人体解析数据集

数据集下载地址：http://suo.nz/2ll7hiCrowd Instance-level Human Parsing (CIHP) 数据集包含 38,280 张多人图像，这些图像具有精细的注释、高外观可变性和复杂性。该数据集可用于人体部分分割任务。

WoodScape自动驾驶鱼眼数据集

数据集下载地址：http://suo.nz/2sRklZWoodScape 包含四个环视摄像头和九项任务，包括分割、深度估计

、3D 边界框检测和新型污染检测

。为超过 10,000 张图像提供实例级别的 40 个类的语义注释。

3.图像分类

FruitNet水果分类/识别数据集

下载链接：http://suo.nz/2Cfo4y需要高质量的水果图像来解决水果分类和识别问题。要构建机器学习模型，整洁干净的数据集是基本要求。为了这个目标，我们创建了名为“FruitNet”的六种流行印度水果的数据集。该数据集包含 6 种不同类别水果的 14700 多张经过处理的格式的高质量图像。图像分为 3 个子文件夹 1) 优质水果 2) 劣质水果和 3) 混合质量水果。每个子文件夹包含 6 个水果图像，即苹果、香蕉、番石榴

、酸橙、橙子和石榴。使用具有高端分辨率相机的手机来捕捉图像。这些图像是在不同的背景和不同的光照条件下拍摄的。建议的数据集可用于训练，水果分类或重组模型的测试和验证。

卫星图像分类

下载链接：http://suo.nz/2D00yp卫星图像分类数据

集-RSI-CB256，该数据集有 4 个不同的类别，混合了传感器和谷歌地图

快照

intel 自然风光图像分类数据集

下载链接：http://suo.nz/2KwdmY这是世界各地自然风光的图像数据。内容：此数据包含分布在 6 个类别下的大约 25,000 张大小为 150x150 的图像。{'建筑物'-> 0， '森林'-> 1， '冰川'-> 2， '山'-> 3， '海'-> 4， '街道'-> 5}

建筑遗产元素图像数据集

下载链接：http://suo.nz/2RmsZlArchitectural Heritage Elements Dataset (AHE) 是一个图像数据集，用于开发深度学习算法和建筑遗产图像分类中的特定技术。该数据集包含 10235 张图像，分为 10 个类别：祭坛：829 张图像；后殿：514 张图片；钟楼：1059张图片；栏目：1919张图片；圆顶（内部）：616 张图像；圆顶（外部）：1177 张图像；飞扶壁

：407张图片；Gargoyle（和 Chimera）：1571 张图像；彩色玻璃：1033 幅图像；保险库：1110 张图像。

贝壳或鹅卵石：图像分类数据集

下载链接：http://suo.nz/2YSG42数据集包含两个类：贝壳或卵石。该数据集可用于二元分类

任务，以确定某个图像是贝壳还是鹅卵石。

板球-足球-棒球分类

数据集下载链接：http://suo.nz/33juP6该数据集包含 252 张打板球、踢足球和打棒球的图像。主文件夹中有 3 个子文件夹 (1) cricket (2) football (3) baseball (cricket-football-baseball)。

花卉数据集

数据集下载地址：http://suo.nz/2fGKVt该数据集包含 4242 张花卉图像。数据收集

基于数据flicr、google images、yandex images。此数据集可用于从照片中识别植物。数据图片会分为五类：洋甘菊、郁金香、玫瑰、向日葵、蒲公英

。每个种类大约有800张照片。照片分辨率不高，约为 320x240 像素。照片不会缩小到单一尺寸，它们有不同的比例。

90种动物图像数据集

数据集下载地址：http://suo.nz/2ncY0a在这个数据集中有 90 个不同类别的 5400 张动物图像。此数据集是从 Google 图片创建的：https://images.google.com/。所有照片将按照其所属类别存放于各自的文件夹下。动物类别包括：羚羊，獾，蝙蝠，熊，蜜蜂，甲虫，野牛，公猪，蝴蝶，猫毛虫，黑猩猩

等。该数据集中的图像大小不固定，可能需要后续的处理。

衣服数据集

数据集下载地址：http://suo.nz/2uJaOJ衣服数据集总共收集了 20 种衣服的 5,000 张图像。该数据集是根据公共领域许可 (CC0) 发布的。我们使用了三种不同的方式来收集数据

集：Toloka——众包平台；社交媒体上的网络众包计划；Tagias——一家专门从事数据收集的公司。标签是使用 IPython 小部件手动完成的，同时我们使用简单的神经网络

纠正了标签错误。数据集包含 20 个类，包括T 恤（1011 件），长袖（699 件），裤子（692 件），鞋子（431 件）衬衫（378 件），连衣裙（357 件），外套（312 件），短裤（308 件），帽子（171 件），裙子（155 件），西装外套（109 件）等。

商标数据集

数据集下载地址：http://suo.nz/2CfnTq在这项工作中，我们构建了一个大规模的 logo 数据集 Logo-2K+，它涵盖了来自真实世界 logo 图像的各种 logo 类别。我们生成的徽标数据集包含 167,140 张图像，具有 10 个根类别和 2,341 个类别。

食物图像数据集

数据集下载地址：http://suo.nz/2D00oT该数据集包含完整 food-101 数据的许多不同子集。为了给图像分析制作一个比 CIFAR10 或 MNIST 更简单的训练集，该数据包括图像的大规模缩小版本，以实现快速测试。数据已被重新格式化为 HDF5，特别是 Keras HDF5Matrix，这样可以轻松读取它们。

4.垃圾分类、水下垃圾/口罩垃圾/烟头垃圾检测

AquaTrash垃圾识别数据集

数据集下载链接：http://suo.nz/2CdMGi该数据集包含 369 张用于深度学习的垃圾图像。总共有 470 个边界框。共有 4 类 {(0: glass), (1:paper), (2:metal), (3:plastic)}

口罩垃圾检测

数据集下载链接：http://suo.nz/2CYpbL这个数据集是一个极具挑战性的集合，包含从 1200 多个城市和农村地区捕获和众包的 7000 多张原始 Masks 图像，其中每张图像都由DC Labs 的计算机视觉

专业人员手动审查和验证。数据集大小：7000+ 捕获者

：超过 1200 多个众包贡献者分辨率：99% 图像高清及以上（1920x1080 及以上）地点：拍摄于印度 900 多个城市多样性：各种照明条件，如白天、夜晚、不同的距离、观察点等使用设备：2020-2021 年使用手机拍摄用途：口罩检测、口罩隔离、垃圾口罩检测等

烟头垃圾数据集

数据集下载链接：http://suo.nz/2KuC0k该数据集由一组 2200 张合成合成的地面香烟图像组成。它专为训练 CNN（卷积神经网络

）而设计。

水下垃圾检测数据集

数据集下载链接：http://suo.nz/2RkRCH该数据来自 J-EDI 海洋垃圾数据集。构成该数据集的视频在质量、深度、场景中的对象和使用的相机方面差异很大。它们包含许多不同类型的海洋垃圾的图像，这些图像是从现实世界环境中捕获的，提供了处于不同衰减、遮挡和过度生长状态的各种物体。此外，水的清晰度和光的质量因视频而异。这些视频经过处理以提取 5,700 张图像，这些图像构成了该数据集，所有图像都在垃圾实例、植物和动物等生物对象以及 ROV 上标有边界框。

垃圾分类数据集

数据集下载链接：http://suo.nz/2YR4Ho该数据集包含来自 12 个不同类别的生活垃圾的 15,150 张图像；纸、纸板、生物、金属、塑料、绿色玻璃、棕色玻璃、白色玻璃、衣服、鞋子、电池和垃圾。

Kaggle 垃圾分类图片数据集

数据集下载链接：http://suo.nz/36mRLb该数据集是图片数据，分为训练集85%（Train）和测试集

15%（Test）。其中O代表Organic（有机垃圾），R代表Recycle（可回收）

生活垃圾数据集

数据集下载链接：http://suo.nz/3dT4PS大约9000多张独特的图片。该数据集由印度国内常见垃圾对象的图像组成。图像是在各种照明条件、天气、室内和室外条件下拍摄的。该数据集可用于制作垃圾/垃圾检测模型、环保替代建议、碳足迹生成等。

垃圾溢出数据集

数据集下载链接：http://suo.nz/2fJocH

SpotGarbage垃圾识别数据集

数据集下载链接：http://suo.nz/2nfBho图像中的垃圾（GINI）数据集是SpotGarbage引入的一个数据集，包含2561张图像，956张图像包含垃圾，其余的是在各种视觉属性方面与垃圾非常相似的非垃圾图像。

5.目标跟踪

Temple Color 128

数据集下载链接：http://suo.nz/2dKEEL本数据集包含一大组 128 种颜色序列，带有基本事实和挑战因素注释（例如，遮挡）

NfS高帧率视频数据集

数据集下载链接：http://suo.nz/34o8df第一个更高帧率的视频数据集（称为极品飞车

- NfS）和视觉对象跟踪基准。该数据集包含 100 个视频（380K 帧），这些视频是使用现在常见的更高帧率 (240 FPS) 摄像机从现实世界场景中捕获的。所有帧都用轴对齐的边界框进行注释，所有序列都用九个视觉属性手动标记——例如遮挡、快速运动、背景杂乱等。

VOT2020

数据集下载链接：http://suo.nz/2W7iD5

PathTrack 数据集

数据集下载链接：http://suo.nz/2OFhXy用于多目标跟踪

(MOT)。PathTrack 数据集包含 720 个视频序列中的 15,000 多个人的轨迹。

ALOV300++跟踪数据集

数据集下载链接：http://suo.nz/2dKDTlALOV++，Amsterdam Library of Ordinary Videos for tracking 是一个物体追踪视频数据，旨在对不同的光线、通透度、泛着条件、背景杂乱程度、焦距下的相似物体的追踪。

6.口罩识别检测

SF-MASK

数据集下载链接：http://suo.nz/2E6ADA从监控录像中对有面具和无面具的人脸进行分类是最困难的任务之一，数据集SF-MASK来解决这些问题，该数据集适用于小尺寸人脸、部分隐藏的人脸、各种人脸方向和各种面具类型等。SF-MASK是通过收集已经发布的面具相关数据集而构建的。同时，通过分析现有数据集中缺失的数据和补充缺失的数据，使其更加完整。

口罩检测视频数据集

数据集下载链接：http://suo.nz/2wAnAv一个实时视频/图像数据集，其中包含在大学环境中行走的多个主题（带/不带面具）。每个带注释的帧都包含多个具有唯一标识、边界框和类/标签信息的实例（即人）。数据集和注释可用于训练、验证和测试基于深度学习和计算机视觉的口罩检测算法。以下是数据集的详细信息：视频总帧数：4357 边界框总数：21941 带遮罩的盒子 (MW)：8306 不带遮罩的盒子 (NM)：13635 图像帧：此文件夹包含 4357 个视频帧 (.png)。

口罩佩戴数据集

数据集下载链接：http://suo.nz/2p4avO该Mask Wearing数据集是戴各种口罩的人和不戴口罩的人的物体检测数据集。这些图像最初由台湾伊甸社会福利基金会的 Cheng Hsun Teng 收集，并由 Roboflow 团队重新标记。

口罩检测数据集

数据集下载链接：http://suo.nz/2ojy0l数据集由 2 个文件夹中的 7553 张 RGB 图像组成，分别是 with_mask 和 without_mask。图像被命名为标签 with_mask 和 without_mask。戴口罩的人脸图像为3725张，不戴口罩的人脸图像为3828张。

MDMFR口罩数据集

数据集下载链接：http://suo.nz/2gNkVEMDMFR 数据集由两个主要集合组成，1) 面罩检测和 2) 蒙面面部识别

。我们的 MDMFR 数据集中有 6006 张图像。面罩检测集合包含两类人脸图像，即蒙面和未蒙面。检测数据库

包含 3174 个带掩码和 2832 个不带掩码（未掩码）的图像。

RMFD口罩遮挡人脸数据集

数据集下载链接：http://suo.nz/2ojy0v

7.自动驾驶

ExDark图像数据集

下载地址：http://suo.nz/2lidoIExclusively Dark (ExDARK) 数据集是 7,363 张从极低光环境到黄昏（即 10 种不同条件）的低光图像的集合，具有 12 个对象类（类似于 PASCAL VOC），在图像类级别和局部对象边界上进行了注释盒子。

Nexet车辆检测数据集

下载地址：http://suo.nz/2sKekn50000张带标注的训练图片41190张测试图片图片来自77个国家

Udacity 自动驾驶汽车

数据集

下载地址：http://suo.nz/2Agrp4该数据集包含 11 个类别的 97,942 个标签和 15,000 张图像。有 1,720 个空样本（没有标签的图像）。所有图像均为 1920x1200（下载大小约为 3.1 GB）。本数据集还提供了一个降采样到 512x512（下载大小约 580 MB）的版本，适用于大多数常见的机器学习模型（包括 YOLO v3、Mask R-CNN、SSD 和 mobilenet）。

WoodScape

下载地址：http://suo.nz/2HMEtLWoodScape 包含四个环视摄像头和九项任务，包括分割、深度估计、3D 边界框检测和新型污染检测。为超过 10,000 张图像提供实例级别的 40 个类的语义注释。

BDD100K

下载地址：http://suo.nz/2OCU68UCB的全天候全光照大型数据集，包含1,100小时的HD录像、GPS/IMU、时间戳信息，100,000张图片的2D bounding box标注，10,000张图片的语义分割和实例分割标注、驾驶决策标注和路况标注。官方推荐使用此数据集的十个自动驾驶任务：图像标注、道路检测、可行驶区域分割、交通参与物检测、语义分割、实例分割、多物体检测追踪、多物体分割追踪、域适应和模仿学习。

Linkopings交通标志数据集

下载地址：http://suo.nz/2W97aP超过 20,000 张图像，其中 20% 已标记。包含 3488个交通标志。从超过 350 公里的瑞典道路上记录的公路和城市序列。

非洲地区交通标志数据集

下载地址：http://suo.nz/2WTJGi该数据集已特别针对非洲地区进行了改进。两个开源数据集仅用于提取非洲地区使用的交通标志。该数据集包含来自所有类别的 76 个类，例如监管、警告、指南和信息标志。该数据集总共包含 19,346 张图像和每个类别至少 200 个实例。

8.卫星图像

水体卫星图像的图像

数据集下载地址：http://suo.nz/2ksvWYSentinel-2 卫星拍摄的水体图像集。每张图片都带有一个黑白mask，其中白色代表水，黑色代表除水之外的其他东西。这些掩模是通过计算 NWDI（归一化水差指数）生成的，该指数经常用于检测和测量卫星图像中的植被，但使用更大的阈值来检测水体。

城市航拍图像分割数据集

数据集下载地址：http://suo.nz/2cWiSh此数据集包含用于检查和准备航空影像分割数据集的脚本。该数据集包含一组不同的卫星图像，这些图像用目标城市的建筑物、道路和背景标签进行了注释。

游泳池和汽车卫星图像检测

数据集下载地址：http://suo.nz/3b5ZtQ

人工月球景观数据集

数据集下载地址：http://suo.nz/33zMp9由于月球图像的稀缺性和缺乏注释，通常很难对其进行任何类型的机器学习实验。该数据集的目标是为公众提供人造而逼真的月球景观样本，可用于训练岩石检测算法。这些经过训练的算法可以在实际的月球图片或其他岩石地形图片上进行测试。该数据集目前包含 9,766 个岩石月球景观的真实渲染图，以及它们的分段等价物（3 类是天空、较小的岩石和较大的岩石）。还提供了所有较大岩石和经过处理、清理后的地面实况图像的边界框表。

马萨诸塞州道路数据集

数据集下载地址：http://suo.nz/32Pa9O马萨诸塞州道路数据集由1171幅马萨诸塞州的航空图像组成。与建筑数据一样，每个图像的大小为1500×1500像素，占地2.25平方公里。

UC Merced Land-Use

数据集下载地址：http://suo.nz/2IXmvN这是一个用于研究目的的 21 类土地利用图像数据集。以下每个类别都有 100 张图像：农业飞机棒球钻石海滩建筑物丛林密集住宅森林高速公路高尔夫球场港口路口中型住宅移动房屋

公园立交桥停车场河跑道稀疏住宅储油罐网球场每个图像的尺寸为 256x256 像素。这些图像是从美国地质勘探局

国家地图城市区域图像集中针对全国各个城市地区的大图像中手动提取的。此公共领域图像的像素分辨率为 1 英尺。

Indian Pines

数据集下载地址：http://suo.nz/2JHZ1g这一场景由AVIRIS传感器采集位于印第安纳州

西北部的 Indian Pines 测试场上空，由 145×145 像素和 224 个光谱反射带组成，波长范围为 0.4–2.5 10^(-6) 米。该场景是一个较大场景的子集。印度松树场景包含三分之二的农业和三分之一的森林或其他天然多年生植被。有两条主要的双车道高速公路、一条铁路线，以及一些低密度住房、其他建筑结构和较小的道路。由于该场景是在 6 月份拍摄的，因此一些农作物（玉米、大豆）正处于生长早期阶段，覆盖率不到 5%。可用的基本事实被指定为十六个类别，并且并非全部都是相互排斥的。还通过去除覆盖吸水区域的谱带，将谱带数量减少到 200：[104-108]、[150-163]、220。

KSC

数据集下载地址：http://suo.nz/2Rec5XKSC数据集是于1996年3月份在美国佛罗里达州

肯尼迪太空中心进行成像，截取512×614大小进行标注的高光谱数据集。它是由机载可是红外成像光谱仪（AVIRIS）摄，AVIRIS的波长范围是400-2500nm。空间分辨率为18米，在去除吸水带以及低信噪比波段后，实际用于训练的波段是176个。研究区域有13中地物类型，包括Scrub、Willow swamp、Cabbage palm hammock、Slash pine等。

Washington DC

数据集下载地址：http://suo.nz/2YJZ9KWashington DC数据集是由Hydice传感器获取的一幅华盛顿购物中心上空的航空高光谱影像，数据包含了从 0.4 -2.4 µm可见光和近红外波段范围的共191个波段，数据大小为1280×307。地物类别包括街道，草地，水，碎石小路，树木，阴影和屋顶。

BigEarthNet

数据集下载地址：https://bigearth.net/使用Sentinel-2图像补丁构建BigEarthNet（现在称为BigEarthNet-S2，以前称为BigEarthNet），初步选择了2017年6月至2018年5月期间在欧洲10个国家（奥地利、比利时、芬兰、爱尔兰、科索沃

、立陶宛、卢森堡、葡萄牙、塞尔维亚、瑞士）。所有图块均通过 Sentinel-2 Level 2A 产品生成和格式化工具 (sen2cor v2.5.5) 进行了大气校正。然后，它们被分为 590,326 个不重叠的图像块。每个图像块都由 2018 年 CORINE 土地覆盖数据库 (CLC 2018) 提供的多个土地覆盖类别（即多标签）进行注释。BigEarthNet中的标签属于2018年首次发布的标签。

9.农业相关

DeepWeeds 杂草类型分类数据集

下载链接：http://suo.nz/2OmaTQ数据集包含 17,509 张图像，这些图像捕捉了八种原产于澳大利亚的不同杂草以及邻近的植物群。选定的杂草品种是昆士兰州牧草地的本地品种。它们包括：“中国苹果

”、“蛇草”、“马缨丹”、“刺金合欢”、“暹罗草

”、“白花菊”、“橡胶藤”和“帕金森属植物”。这些图像是从昆士兰以下地点的杂草侵扰中收集的：“Black River”、“Charters Towers”、“Cluden”、“Douglas”、“Hervey Range”、“Kelso”、“McKinlay”和“Paluma”。

仙人掌航拍图片数据集

下载链接：http://suo.nz/2VSnYx在此数据集中，展示了 16,000 多个用于植物识别或分类的柱状仙人掌 (Neobuxbaumia tetetzo) 示例。

农作物图像分类（小麦、水稻、甘蔗、玉米等）

下载链接：http://suo.nz/33oB1C数据集（作物图像）包含每种农业作物（玉米、小麦、黄麻、水稻和甘蔗）的 40 多张图像数据集（kag2）包含每类作物图像的 159 多张增强图像。增强包括水平翻转、旋转、水平平移、垂直平移。

5种不同的水稻图像数据集

下载链接：http://suo.nz/349aVN

使用了 Arborio、Basmati、Ipsala、Jasmine 和 Karacadag 水稻品种。
数据集(1) 有75K 幅图像，包括每个水稻品种的15K 幅图像。数据集（2）有 12 个形态特征、4 个形状特征和 90 个颜色特征。

玉米叶感染数据集

下载链接：http://suo.nz/3aZ0xg收集了部分被秋粘虫等害虫感染的玉米叶片图像。有 Healthy 和 Infected 文件夹，每个文件夹都包含各自的图像。此外，还使用 VoTT 为受感染的图像准备了注释文件。

打架识别相关

监控摄像头下的打架检测

数据集下载链接：http://suo.nz/39IbxQ该数据集是从包含打架实例的 Youtube 视频中收集的。此外，还包括一些来自常规监控摄像机视频的非打架序列。

总共有300个视频，150个打架+150个非打架
视频时长 2 秒
示例中仅包含与打架相关的部分

此外，由于任务是通过监控摄像头检测打斗，因此首选没有背景运动的视频作为样本。此外，还包括各种打斗场景，例如用物体撞击、踢打、拳击、摔跤。示例中的环境也各不相同，例如咖啡馆、街道、公共汽车等。

UBI-Fight异常事件检测数据集

数据集下载链接：http://suo.nz/3aoBUhUBI-Fights 数据集是一个独特的全新大型数据集，涉及特定的异常检测

并仍然在打斗场景中提供广泛的多样性，该数据集包含 80 小时的视频，在帧级别进行了完全注释。由 1000 个视频组成，其中 216 个视频包含打斗事件，784 个是正常的日常生活场景。删除所有可能干扰学习过程的不必要的视频片段（例如，视频介绍、新闻等）。

曲棍球比赛

检测数据集

数据集下载链接：http://suo.nz/2ceViI该数据集中包含 1000 个序列，分为两组：打斗和非打斗。

打架识别图像数据集

数据集下载链接：http://suo.nz/2jL8np该数据集是为“打斗探测器

”项目创建的，该项目检测静止图像中的打斗，然后将打斗探测器移动到上下文中具有时间维度的下一级视频检测。打斗数据集是从视频数据集 HMDB51 数据集创建的。

真实街头斗殴视频数据集

数据集下载链接：http://suo.nz/2rhiQO该数据集包含从 youtube 视频中收集的 1000 个暴力视频和 1000 个非暴力视频，数据集中的暴力视频包含多种环境和条件下的许多真实街头斗殴情况。数据集中的非暴力视频也是从许多不同的人类行为中收集的，如运动、饮食、步行等。

人脸

FePh面部表情数据集

数据集下载链接：http://suo.nz/2zIouL手语背景下带注释的序列化面部表情数据集，其中包含从公共电视台 PHOENIX 的每日新闻和天气预报

中提取的 3000 多张面部图像。与大多数当前现有的面部表情数据集不同，FePh 提供具有不同头部姿势、方向和运动的序列化半模糊面部图像。

不平衡面部表情数据集

数据集下载链接：http://suo.nz/2OKM2R图像大小保持 96x96，并使用改进后的标签。源数据集被分成两个子集——训练和测试。train.csv 和 test.csv 文件分别包含训练和测试子集的标签到文件名的映射。类别有：愤怒、蔑视、厌恶、恐惧、快乐、中性、悲伤和惊讶。

FER-2013

数据集下载链接：http://suo.nz/2WgZ7y数据由 48x48 像素的人脸灰度图像

组成。人脸已自动注册，因此人脸或多或少居中，并且在每张图像中占据大致相同的空间训练集包含 28,709 个示例，公共测试集包含 3,589 个示例。

FANE：面部表情和情绪数据集

数据集下载链接：http://suo.nz/2X1BD1FANE 是一个图像数据集，用于对野外图像中的面部表情和情绪进行分类。数据集中有九个类别。总共有16,913 张图片。图像是从多个来源收集的，包括其他面部表情数据集，以及主要通过网络抓取的互联网。使用手动注释和预训练模型对图像进行标记。

小鼠面部表情数据集

数据集下载链接：http://suo.nz/34xOHI老鼠在三种情绪状态（中性、疼痛和发痒）下的面部图像。

本文链接：https://blog.csdn.net/boon_228/article/details/133900198

原作者删帖不实内容删帖广告或垃圾文章投诉

智能推荐

什么是内部类？成员内部类、静态内部类、局部内部类和匿名内部类的区别及作用？_成员内部类和局部内部类的区别-程序员宅基地

文章浏览阅读3.4k次，点赞8次，收藏42次。一、什么是内部类？or 内部类的概念内部类是定义在另一个类中的类；下面类TestB是类TestA的内部类。即内部类对象引用了实例化该内部对象的外围类对象。public class TestA{ class TestB {}}二、为什么需要内部类？or 内部类有什么作用？1、内部类方法可以访问该类定义所在的作用域中的数据，包括私有数据。2、内部类可以对同一个包中的其他类隐藏起来。3、当想要定义一个回调函数且不想编写大量代码时，使用匿名内部类比较便捷。三、内部类的分类成员内部_成员内部类和局部内部类的区别

分布式系统_分布式系统运维工具-程序员宅基地

文章浏览阅读118次。分布式系统要求拆分分布式思想的实质搭配要求分布式系统要求按照某些特定的规则将项目进行拆分。如果将一个项目的所有模板功能都写到一起，当某个模块出现问题时将直接导致整个服务器出现问题。拆分按照业务拆分为不同的服务器，有效的降低系统架构的耦合性在业务拆分的基础上可按照代码层级进行拆分(view、controller、service、pojo)分布式思想的实质分布式思想的实质是为了系统的..._分布式系统运维工具

用Exce分析l数据极简入门_exce l趋势分析数据量-程序员宅基地

文章浏览阅读174次。1.数据源准备2.数据处理step1：数据表处理应用函数：①VLOOKUP函数; ② CONCATENATE函数终表：step2：数据透视表统计分析（1）透视表汇总不同渠道用户数, 金额（2）透视表汇总不同日期购买用户数，金额（3）透视表汇总不同用户购买订单数，金额step3：讲第二步结果可视化, 比如, 柱形图（1）不同渠道用户数, 金额（2）不同日期..._exce l趋势分析数据量

宁盾堡垒机双因素认证方案_horizon宁盾双因素配置-程序员宅基地

文章浏览阅读3.3k次。堡垒机可以为企业实现服务器、网络设备、数据库、安全设备等的集中管控和安全可靠运行，帮助IT运维人员提高工作效率。通俗来说，就是用来控制哪些人可以登录哪些资产（事先防范和事中控制），以及录像记录登录资产后做了什么事情（事后溯源）。由于堡垒机内部保存着企业所有的设备资产和权限关系，是企业内部信息安全的重要一环。但目前出现的以下问题产生了很大安全隐患：密码设置过于简单，容易被暴力破解；为方便记忆，设置统一的密码，一旦单点被破，极易引发全面危机。在单一的静态密码验证机制下，登录密码是堡垒机安全的唯一_horizon宁盾双因素配置

谷歌浏览器安装（Win、Linux、离线安装）_chrome linux debian离线安装依赖-程序员宅基地

文章浏览阅读7.7k次，点赞4次，收藏16次。Chrome作为一款挺不错的浏览器，其有着诸多的优良特性，并且支持跨平台。其支持（Windows、Linux、Mac OS X、BSD、Android），在绝大多数情况下，其的安装都很简单，但有时会由于网络原因，无法安装，所以在这里总结下Chrome的安装。Windows下的安装：在线安装：离线安装：Linux下的安装：在线安装：离线安装：..._chrome linux debian离线安装依赖

烤仔TVの尚书房 | 逃离北上广？不如押宝越南“北上广”-程序员宅基地

文章浏览阅读153次。中国发达城市榜单每天都在刷新，但无非是北上广轮流坐庄。北京拥有最顶尖的文化资源，上海是“摩登”的国际化大都市，广州是活力四射的千年商都。GDP和发展潜力是衡量城市的数字指...

随便推点

java spark的使用和配置_使用java调用spark注册进去的程序-程序员宅基地

文章浏览阅读3.3k次。前言spark在java使用比较少，多是scala的用法，我这里介绍一下我在项目中使用的代码配置详细算法的使用请点击我主页列表查看版本jar版本说明spark3.0.1scala2.12这个版本注意和spark版本对应，只是为了引jar包springboot版本2.3.2.RELEASEmaven <dependency> <gro_使用java调用spark注册进去的程序

汽车零部件开发工具巨头V公司全套bootloader中UDS协议栈源代码，自己完成底层外设驱动开发后，集成即可使用_uds协议栈源代码-程序员宅基地

文章浏览阅读4.8k次。汽车零部件开发工具巨头V公司全套bootloader中UDS协议栈源代码，自己完成底层外设驱动开发后，集成即可使用，代码精简高效，大厂出品有量产保证。:139800617636213023darcy169_uds协议栈源代码

AUTOSAR基础篇之OS(下)_autosar 定义了 5 种多核支持类型-程序员宅基地

文章浏览阅读4.6k次，点赞20次，收藏148次。AUTOSAR基础篇之OS(下)前言首先，请问大家几个小小的问题，你清楚：你知道多核OS在什么场景下使用吗？多核系统OS又是如何协同启动或者关闭的呢？AUTOSAR OS存在哪些功能安全等方面的要求呢？多核OS之间的启动关闭与单核相比又存在哪些异同呢？。。。。。。今天，我们来一起探索并回答这些问题。为了便于大家理解，以下是本文的主题大纲：[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-JCXrdI0k-1636287756923)(https://gite_autosar 定义了 5 种多核支持类型

VS报错无法打开自己写的头文件_vs2013打不开自己定义的头文件-程序员宅基地

文章浏览阅读2.2k次，点赞6次，收藏14次。原因：自己写的头文件没有被加入到方案的包含目录中去，无法被检索到，也就无法打开。将自己写的头文件都放入header files。然后在VS界面上，右键方案名，点击属性。将自己头文件夹的目录添加进去。_vs2013打不开自己定义的头文件

【Redis】Redis基础命令集详解_redis命令-程序员宅基地

文章浏览阅读3.3w次，点赞80次，收藏342次。此时，可以将系统中所有用户的 Session 数据全部保存到 Redis 中，用户在提交新的请求后，系统先从Redis 中查找相应的Session 数据，如果存在，则再进行相关操作，否则跳转到登录页面。此时，可以将系统中所有用户的 Session 数据全部保存到 Redis 中，用户在提交新的请求后，系统先从Redis 中查找相应的Session 数据，如果存在，则再进行相关操作，否则跳转到登录页面。当数据量很大时，count 的数量的指定可能会不起作用，Redis 会自动调整每次的遍历数目。_redis命令

URP渲染管线简介-程序员宅基地

文章浏览阅读449次，点赞3次，收藏3次。URP的设计目标是在保持高性能的同时，提供更多的渲染功能和自定义选项。与普通项目相比，会多出Presets文件夹，里面包含着一些设置，包括本色，声音，法线，贴图等设置。全局只有主光源和附加光源，主光源只支持平行光，附加光源数量有限制，主光源和附加光源在一次Pass中可以一起着色。URP：全局只有主光源和附加光源，主光源只支持平行光，附加光源数量有限制，一次Pass可以计算多个光源。可编程渲染管线：渲染策略是可以供程序员定制的，可以定制的有：光照计算和光源，深度测试，摄像机光照烘焙，后期处理策略等等。_urp渲染管线