【亲测】Swin-Transformer 自定义数据集图像分类_swin-transformer类别数-程序员宅基地

技术标签: 深度学习  transformer  pytorch  

Swin-Transformer是当前热门的深度学习框架,适用于多种视觉任务,相关的原理,网上有很多资源,大家可自行查看,这里主要介绍其在图像分类方面的代码调试经验,方便各位快速上手实验。Swin-Transformer代码链接点击进入

在这里插入图片描述

实验环境及配置:
Pytorch: 1.7.1
CUDA: 10.1.243 版本(使用 nvcc --version 查看)
GPU:显存8G
操作系统: Centos 7
1 环境配置

其实根据官方的配置步骤,可以实现快速的配置,但是在进行到 Nvidia apex 那个步骤的时候,可能会出现一些问题,因为可能我们不是那么容易安装 apex 这个加速框架,等下会进一步介绍。下面先按照代码官方的配置过程来:

1.1 下载官网代码,也可以用官网推荐的以下命令:

git clone https://github.com/microsoft/Swin-Transformer.git (可能会出翔网络问题)
cd Swin-Transformer (进入下载的文件夹)

如果您的网络有问题,不能使用以上命令下载,则直接在官网界面点击下载 zip 压缩包,再进行解压就行。
在这里插入图片描述
1.2 创建并激活虚拟环境,使用以下命令:

conda create -n swin python=3.7 -y (其中虚拟环境 swin 名字,可以自定义)
conda activate swin (进入该虚拟环境)

1.3 确定自己GPU 安装的 CUDA 版本(运行时的版本),使用 nvcc -V (或 nvcc --version)使用 nvidia-smi 看到的是 CUDA 为驱动API版本,和运行时的版本不同,这个需要注意。

用于支持driver API的必要文件(如libcuda.so)是由GPU driver installer安装的。nvidia-smi就属于这一类API。
用于支持runtime API的必要文件(如libcudart.so以及nvcc)是由CUDA Toolkit installer安装的。一般后续安装各种包或库,需要此类CUDA编译,所以我们后来需要安装和这个版本对应的 cudatoolkit 版本。
在这里插入图片描述

下面是安装包或库,这个需要在 你刚才创建的那个虚拟环境下进行安装

1.4 安装 PyTorch==1.7.1 and torchvision==0.8.2 with CUDA==10.1:,这里的CUDA 和上面的运行时 API 一样。

conda install pytorch==1.7.1 torchvision==0.8.2 cudatoolkit=10.1 -c pytorch

1.5 安装 timm 包

pip install timm==0.3.2

PyTorch Image Models (timm)是一个图像模型(models)、层(layers)、实用程序(utilities)、优化器(optimizers)、调度器(schedulers)、数据加载/增强(data-loaders / augmentations)和参考训练/验证脚本(reference training / validation scripts)的集合,目的是将各种SOTA模型组合在一起,从而能够重现ImageNet的训练结果

1.6 安装 apex
官方安装语句,但是有时候 git 会因为网络问题,不能下载,且在运行下面第三句话时 pip 时会出现问题。所以我们尽量介绍另外的安装策略。

git clone https://github.com/NVIDIA/apex
cd apex
pip install -v --disable-pip-version-check --no-cache-dir --global-option="--cpp_ext" --global-option="--cuda_ext" ./

如果上面的 git 命令无法下载,则采用下面的策略:
在这里插入图片描述
解压下载的文件后,进那个 apex 文件夹就行
在这里插入图片描述
下面说下,我安装过程中出现的问题有:
1) 当然如果您上面的 cudatoolkit 版本没安装正确,同样也会报一个 mismatch 的错误,所以以上的安装一定要安装对版本。
2)同样如果直接运行第三句命令,还会报一个,apex 文件夹中没有 setup.py 文件等,此时注意到,上面的图中,在apex 文件夹外就有个 setup.py 把那个文件直接复制进 apex 文件夹,再次运行上面的 第三条命令,看看能不能顺利执行,如果最终成功了,恭喜您,如果没成功,不要着急,我还有另外的安装方式。

如果上文的命令不行,请使用下面的命令:
1 在 apex 文件夹中运行 python setup.py install
2 然后运行 python setup.py build 即可,然后编译为我后面截图那个文件夹,
3 把那个apex 复制到swin-tranformer 的代码目录,即可。
如果还不行, 可以直接使用 pip install apex 试试

在这里插入图片描述
这个是我编译好的apex 文件夹情况,
在这里插入图片描述
编译好的 apex 直接复制到 swin-transformer 文件夹
在这里插入图片描述
1.7 安装一些其他包:

pip install opencv-python==4.4.0.46 termcolor==1.1.0 yacs==0.1.8

以上就是环境配置,如果配置完全,即可进行下面的步骤了。

2 数据准备

数据集处理成 imagenet 的格式,即每个类别放在一个文件夹,最好是类名直接命名为数字形式,也可以是真是类标,然后将 训练集 验证集 测试集 分文件夹存储,每个文件夹的格式就像下面的 样子。
在这里插入图片描述
在这里插入图片描述

代码更改

1 打开 config.py , 将数据集的文件夹写进去,这样到时候训练时候,就不用再写了。
2 修改类别的数量,因为默认是 1000类,
3 下载预训练模型,并在 config.py中配置

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
使用百度云盘下载即可。
在这里插入图片描述
**加粗样式
**
还要改正几个地方,
1 build.py 中的 类别数数量
在这里插入图片描述
2 预训练模型加载过程中,由于自定义数据集类别未必是1000 所以需要改utils.py 中的这个函数,我这里是加了个判断,您也可以改为其他的形式。
在这里插入图片描述
3 测试时候,需要将 数据集改为 test 数据集,因为代码默认 为验证集,在 build.py 中
在这里插入图片描述

单块GPU训练和测试的命令

训练

python -m torch.distributed.launch --nproc_per_node 1 --master_port 12345  main.py \
--cfg configs/swin_tiny_patch4_window7_224.yaml  --batch-size 8 

测试

python -m torch.distributed.launch --nproc_per_node 1 --master_port 12345  main.py --eval\
--cfg configs/swin_tiny_patch4_window7_224.yaml --resume 训练模型路径 --batch-size 8 

【以上即为Swin-Transformer图像分类调试过程】
训练过程:
在这里插入图片描述

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/qq_29750461/article/details/120863541

智能推荐

第三十六篇、基于Arduino uno,获取红外寻迹传感器的原始值——结果导向_怎么检测红外寻迹模块返回值-程序员宅基地

文章浏览阅读385次。基于Arduino uno,获取红外寻迹传感器的原始值_怎么检测红外寻迹模块返回值

基于单片机的无线投票显示系统设计-程序员宅基地

文章浏览阅读494次,点赞5次,收藏9次。单片机(Microcontroller)是一种集成了微处理器核心、存储器、输入/输出接口和定时器等功能模块的集成电路芯片,具有体积小、功耗低、性价比高等特点,被广泛应用于各个领域。单片机的发展历史可以追溯到20世纪70年代,当时的单片机功能有限,主要用于简单的控制任务。

生成对抗网络GAN_生成对抗网络 python代码-程序员宅基地

文章浏览阅读412次。https://zhuanlan.zhihu.com/p/54096381_生成对抗网络 python代码

html——网页上添加表格_怎样在网站中添加表格别人可以下载-程序员宅基地

文章浏览阅读5.2k次,点赞7次,收藏18次。有时候我们需要在网页上展示一些数据,如某公司想在网页上展示公司的库存清单。如下表:想在网页上展示上述表格效果可以使用以下代码:创建表格的四个元素:table、tbody、tr、th、td1、…:整个表格以标记开始、标记结束。2、…:当表格内容非常多时,表格会下载一点显示一点,但如果加上标签后,这个表格就要等表格内容全部下载完才会显示。如右侧代码编辑器中的代码。3、…_怎样在网站中添加表格别人可以下载

《Qt MOOC系列教程》第五章第三节:创建新的QML类型_qmlregisteruncreatabletype-程序员宅基地

文章浏览阅读770次。到目前为止,我们已经讨论了如何将对象实例公开给QML上下文。有时我们还希望在QML中可以使用注册类本身。注册允许将类当作QML中的数据类型来使用。此外,注册还可以提供其他功能,比如允许在QML中将类用作可实例化的QML对象类型,或者允许在QML中导入和使用类的单例实例。通常我们使用Q_OBJECT宏注册从QObject派生的类,也可以用Q_GADGET宏声明一个比QObject“更轻”的版本。在这些更轻的类中,我们可以访问它们的属性、枚举和可调用的方法,但不能使用信号槽系统,我们稍后会进行介绍。1. 注_qmlregisteruncreatabletype

头文件与命名空间的关系_c#中命名空间和c语言中头文件之间的关系-程序员宅基地

文章浏览阅读2.1k次,点赞7次,收藏15次。头文件与命名空间的关系 Q:有些书说有些头文件不在std里是什么意思?std里包含些什么?为什么不用std就不能使用cout?头文件中声明的东西为什么在使用的时候需要先using namespace std;一下?如果我不用#include和其他头文件。只用using namespace std 的话,是不能用cout的。这说明cout是在iostream里声明_c#中命名空间和c语言中头文件之间的关系

随便推点

python实现矩阵乘法(实现文件读写操作)_python 读取csv矩阵乘法-程序员宅基地

文章浏览阅读1.2k次,点赞2次,收藏8次。注释dtype=np.int代表导入数据的格式为整数delimiter=’,'代表原始数据的存储格式为以‘,’为间隔原始文件中以‘#’开头的行代表被注释,不会被np.loadtxt读取通过[[0] * b for i in range(a)]的方式初始化一个x[a][b]的二维数组np.savetxt()函数可以用来保存数据,第一个参数为保存数据的路径,其中C是自定义的文件名,如果该文..._python 读取csv矩阵乘法

《军团要塞2》绘画渲染_军团要塞画师-程序员宅基地

文章浏览阅读1.4k次。军团要塞2绘画渲染(a)美术概念 (b)游戏内玩家看到的角色摘要在《军团要塞2》中我们提出了一整套美术方案和新的实时渲染技术,这种技术能实现出一种独一无二的渲染风格。《军团要塞2》由美术和程序基于20世纪初时商业插画中的传统风格合作完成。在这篇论文中,我们会结合美术方向与技术选择,来讨论如何支持美术目标和玩法限制。除了实现一种有冲击力的风格外,我们也设计了边缘光照和亮度与色调变化的着色器技..._军团要塞画师

【数字图像处理实验二】:RGB图3个通道的提取、RGB图转灰度图、图片反转、图片亮度调整、直方图显示_jupter rgb灰度直方图提取-程序员宅基地

文章浏览阅读9.6k次,点赞8次,收藏65次。这里介绍:RGB图3个通道的提取、RGB图转灰度图、图片反转、图片亮度调整具体操作,需导入的库如下:原图如下:结果如下,从左到右分别是:Red,Green,Blue这里借助skimage库中的exposure函数来进行图像亮度的调整结果如下:........._jupter rgb灰度直方图提取

2023年地级、省级、县级、国界、九段线的shp数据_九段线shp数据-程序员宅基地

文章浏览阅读931次。2023年地级、省级、县级、国界、九段线的shp数据_九段线shp数据

python高校本科生学习成长记录系统的设计与实现flask-django-php-nodejs-程序员宅基地

文章浏览阅读797次,点赞16次,收藏19次。二十一世纪我们的社会进入了信息时代,信息管理系统的建立,大大提高了人们信息化水平。传统的管理方式对时间、地点的限制太多,而在线管理系统刚好能满足这些需求,在线管理系统突破了传统管理方式的局限性。于是本文针对这一需求设计并实现了一个基于django高校本科生学习成长记录系统,为了简捷并有效的解决学习各方面的问题。

redis实现分布式session共享_redis分布式session共享-程序员宅基地

文章浏览阅读7.7k次。为什么要共享session?我们使用单台Tomcat的时候不会有共享sesssion的疑虑,只要使用Tomcat的默认配置即可,session即可存储在Tomcat上。但是随着业务的扩大,增加Tomcat节点构成Tomcat集群大势所趋,分布式带来了增加更大规模并发请求的优势,但是也随之到来了一个问题,每个Tomcat只存储来访问自己的请求产生的session,如果Tomcat-A已经为客..._redis分布式session共享

推荐文章

热门文章

相关标签