ST-GCN复现过程(Ubuntu20.04+GPU)(已完结)_stgcn复现-程序员宅基地

技术标签: 深度学习  人工智能  视频动作识别复现  神经网络  

参考

ST-GCN源码运行完整版(含OpenPose编译安装)及常见问题_咬我呀_Gemini的博客-程序员宅基地

 关于在ubuntu20.04下openpose环境安装_openpose ubuntu安装_键盘强者的博客-程序员宅基地

Linux服务器下openpose搭建_linux 安装openpose_蓝雨飞扬7的博客-程序员宅基地
kinetics-skeleton格式行为数据提取方法_can not find pose estimation results._青年夏日科技工作者的博客-程序员宅基地

配置:

CUDA11.1

cudnn 8.1.0

Ubuntu20.04

显卡3070

Python3.6

现有问题:

(1)3.3 节运行离线Demo失败,但目前来看不影响后续训练模型

(2)只能单卡跑,双卡报错还未解决

(3)测试结果比原文少了百分之1.4左右

1.下载源码、预训练模型

源码:

https://gitee.com/chenhongqiong/st-gcn.git

预训练模型:

models - Google 云端硬盘

下载好的模型文件拷贝至源码文件中./models文件路径下

下载数据集

kinetics-skeleton数据集,st-gcn作者提供的预处理kinetics-skeleton数据集是谷歌网盘,需要翻墙才能下载,大概8g。可以通过百度网盘,提取码:sqpx下载,(感谢第四条参考中提供的百度网盘链接)

原始ntu-rgbd数据集:

百度云版本:

GitHub - Hrener/3D-Action-recognition: PyTorch implementation of Two-stream CNN for 3D action recognition

也可以去官网填写申请(我用的这个方法,填写申请之后等一两天,只需要5.8g的骨骼数据):

ROSE Lab

2.环境搭建

2.1创建虚拟环境

conda create -n stgcn python=3.6
activate stgcn

2.2安装依赖项(在上述虚拟环境中)

2.2.1 pytorch

去官网查看对应版本的安装指令

PyTorch

以前的版本查询Previous PyTorch Versions | PyTorch

服务器的cuda是11.1,因此对应安装指令为

conda install pytorch==1.8.0 torchvision==0.9.0 torchaudio==0.8.0 cudatoolkit=11.1 -c pytorch -c conda-forge

测试安装成功

 2.2.2其他依赖项

conda install ffmpeg

进入st-gcn源码目录下

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

2.3 安装与配置openpose

2.3.1检查是否安装opencv和cmake

 2.3.2下载openpose

git clone https://github.com/CMU-Perceptual-Computing-Lab/openpose.git

如果在终端下载不了,就去网站手动下载(两个应该都行),全部克隆到本地mirrors / CMU-Perceptual-Computing-Lab / openpose · GitCode

https://github.com/CMU-Perceptual-Computing-Lab/openpose/tree/v1.5.0

2.3.3安装CMake GUI

sudo apt-get install cmake-qt-gui

2.3.4安装opencv

sudo apt-get install libopencv-dev

2.3.5安装caffe

sudo apt-get update

sudo apt-get install cmake git unzip

sudo apt-get install libprotobuf-dev libleveldb-dev liblmdb-dev

sudo apt-get install libsnappy-dev libhdf5-serial-dev protobuf-compiler

sudo apt-get install --no-install-recommends libboost-all-dev

sudo apt-get install libatlas-base-dev libopenblas-dev

sudo apt-get install the python3-dev python3-skimage

sudo pip3 install pydot

sudo apt-get install graphviz

如果倒数第二条遇到报错pip3:command not found,见Linux使用pip3报错:pip3:command not found_pip3找不到命令_嵌入式Linux充电站的博客-程序员宅基地

cd openpose/
git submodule update --init --recursive --remote

报错fatal: Not a git repository (or any of the parent directories): .git,见

解决 fatal: Not a git repository (or any of the parent directories): .git 问题_蜗牛有力量的博客-程序员宅基地

sudo bash ./scripts/ubuntu/install_deps.sh

sudo apt install protobuf-compiler libgoogle-glog-dev
cd openpose/3rdparty/
git clone https://github.com/CMU-Perceptual-Computing-Lab/caffe.git
git clone https://github.com/pybind/pybind11

如果上面这两个链接下不了,就用浏览器打开手动下载到本地,然后分别放到caffe和pybind11文件夹内

cd build/
cmake-gui ..

出现图形化界面

 确认上面两个路径没问题后,点击configure,

若报错CMake Error at cmake/Cuda.cmake:227 (message):   cuDNN version >3 is required.

则找到Openpose下 cmake/cuda.cmake file 和 /cmake/modules/FindCuDNN.cmake file.

file(READ {CUDNN_INCLUDE}/cudnn.h CUDNN_VERSION_FILE_CONTENTS)

改为

file(READ {CUDNN_INCLUDE}/cudnn_version.h CUDNN_VERSION_FILE_CONTENTS)

再次configure,无报错,显示configure done

 点击generate,然后关闭,回到终端,依旧是build目录下

make -j`nproc`

等待编译结束...

 跑例程失败

./build/examples/openpose/openpose.bin --image_dir examples/media/ --face --hand

./build/examples/openpose/openpose.bin --video examples/media/video.avi

若运行

./build/examples/openpose/openpose.bin --video examples/media/video.avi --model_pose MPI_4_layers --net_resolution 320x176

则报错模型问题

 参考ubuntu18编译安装opencv3.4.3, caffe和openpose, 踩坑记录._王二小、的博客-程序员宅基地

手动下载模型后放到指定位置

又开始报1vs.0的错误

重新下载caffe GitHub - BVLC/caffe: Caffe: a fast open framework for deep learning.

更改Makefile文件:

LIBRARIES += glog gflags protobuf boost_system boost_filesystem m hdf5_serial_hl hdf5_serial
PYTHON_LIBRARIES ?= boost_python3 python3.6m

复制Makefile.config.example,并重命名为Makefile.config,更改

 仍然报错1vs.0

Problems while running the demo Check failed: status == CUDNN_STATUS_SUCCESS (1 vs. 0) CUDNN_STATUS_NOT_INITIALIZED - openpose - 码客

有人说是cuda和cudnn和gpu版本不匹配,查询版本:cudnn8.1.0,cuda11.1

cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

nvcc -V

 注:nvidia-smi查询到的是显卡支持的最高cuda版本

更新,问题解决了,是服务器显存爆了,显存没问题的话可以运行openpose的测试代码

3按照README.MD进行

3.1 Installation

cd st-gcn
cd torchlight
python setup.py install
cd ..

3.2 Get pretrained models

之前已完成

3.3 运行离线Demo失败

这里参考了复现STGCN CPU版 (ubuntu16.04+pytorch0.4.0+openpose+caffe)_stgcn复现_普通网友的博客-程序员宅基地

修改processor下的demo.realtime.py

sys.path.append('{}/python/openpose/Release'.format(self.arg.openpose))
os.environ['PATH'] = os.environ['PATH'] + ';' + f'{self.arg.openpose}/x64/Release;' + f'{self.arg.openpose}/bin;'

运行新版demo

python3 main.py demo --openpose '/home/zhy/openpose/build' --video '/home/extend/zhy/code/st-gcn/resource/media/skateboarding.mp4'

旧版

python3 main.py demo_old --video /home/extend/zhy/code/st-gcn/resource/media/ta_chi.mp4 --openpose  /home/zhy/openpose/build

运行新版时报错,原因是刚刚改代码的时候tab和空格混用了,全部改成空格就行

 新错误

试试运行旧版demo

 改processor\demo_old.py

openpose = '{}/OpenPoseDemo.exe'.format(self.arg.openpose)

 运行后报错,没有解决,因此无法运行demo文件

3.4 数据预处理

使用以下命令处理ntu数据集,分别是xsub的train和val 还有xview的train和val,最后如果没有做其他更改的话,应该是在st-gcn目录下新建一个data包,保存到data/NTU-RGB-D/nturgb+d_skeletons.

python tools/ntu_gendata.py --data_path /home/extend/zhy/nturgb+d_skeletons

等待处理结束:

kinetics如下

python tools/kinetics_gendata.py --data_path /home/extend/zhy/kinetics-skeleton

3.5 Testing Pretrained Models

3.5.1 kinetics-skeleton

python main.py recognition -c config/st_gcn/kinetics-skeleton/test.yaml

 改batch_size再试一次,

python main.py recognition -c config/st_gcn/kinetics-skeleton/test.yaml --test_batch_size 8

3.5.2 cross-view NTU RGB+D

python main.py recognition -c config/st_gcn/ntu-xview/test.yaml --test_batch_size 8

等待结束

3.5.3 cross-subject NTU RGB+D

python main.py recognition -c config/st_gcn/ntu-xsub/test.yaml --test_batch_size 8

 3.6 训练

3.6.1 cross-view NTU RGB+D

以ntu-xview为例进行训练和测试

先在config/ntu-xview/train.yaml添加如下,并将batchsize改成8

start_epoch = 0	//这里填写上次训练中断时的epoch,如果上次训练了5个epoch(0,1,2,3,4),那么再次训练的时候填5即可
save_interval = 1	 //源码是时10个epoch保存一次模型参数weights,我设置为1
weights = model_path //这里填写最近一个epoch保存的model_weights.pt文件的路径,如果不加上这个参数,则默认训练一个新的模型

 训练代码

python main.py recognition -c config/st_gcn/ntu-xview/train.yaml

报错,=改成:再运行

 报错

改train.yaml的GPU数量为1

 成功开始训练

 参考win10 ST-GCN复现_mizit的博客-程序员宅基地

如果中途暂停可以按照上面的,在train.yaml中更改start_epoch和weights

如下,注意weights要提供绝对路径

 就会接着迭代了

其它问题:试了双显卡训练,报错net/stgcn.py某一行代码的期望输入维度是256,但只提供了3,这个问题没有解决,估计是在这条命令出错了

RuntimeError: Given groups=1, weight of size [60, 256, 1, 1], expected input[8, 3, 1, 1] to have 256 channels, but got 3 channels instead

最后是用单卡,batchsize=56跑的

 如图,ntu-xview的训练结果是84.6

batchsize设为56,尝试等比缩小学习率至0.0875,重新测试

 结果87.47,用这次的模型去测试集跑

3.6.2 cross-subject NTU RGB+D

3.6.3 kinetics-skeleton

这两个数据集的测试方法和ntu-xview步骤相同,将训练时的数据集名字改了就可以,因此不做测试了。

4 结果

4.1 cross-view NTU RGB+D

测试代码

python main.py recognition -c config/st_gcn/ntu-xview/test.yaml --weights /home/extend/zhy/code/st-gcn/work_dir/recognition/ntu-xview/ST_GCN/epoch80_model.pt

结果:

————————————————————(完结)——————————————————

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_44283270/article/details/129811701

智能推荐

攻防世界_难度8_happy_puzzle_攻防世界困难模式攻略图文-程序员宅基地

文章浏览阅读645次。这个肯定是末尾的IDAT了,因为IDAT必须要满了才会开始一下个IDAT,这个明显就是末尾的IDAT了。,对应下面的create_head()代码。,对应下面的create_tail()代码。不要考虑爆破,我已经试了一下,太多情况了。题目来源:UNCTF。_攻防世界困难模式攻略图文

达梦数据库的导出(备份)、导入_达梦数据库导入导出-程序员宅基地

文章浏览阅读2.9k次,点赞3次,收藏10次。偶尔会用到,记录、分享。1. 数据库导出1.1 切换到dmdba用户su - dmdba1.2 进入达梦数据库安装路径的bin目录,执行导库操作  导出语句:./dexp cwy_init/[email protected]:5236 file=cwy_init.dmp log=cwy_init_exp.log 注释:   cwy_init/init_123..._达梦数据库导入导出

js引入kindeditor富文本编辑器的使用_kindeditor.js-程序员宅基地

文章浏览阅读1.9k次。1. 在官网上下载KindEditor文件,可以删掉不需要要到的jsp,asp,asp.net和php文件夹。接着把文件夹放到项目文件目录下。2. 修改html文件,在页面引入js文件:<script type="text/javascript" src="./kindeditor/kindeditor-all.js"></script><script type="text/javascript" src="./kindeditor/lang/zh-CN.js"_kindeditor.js

STM32学习过程记录11——基于STM32G431CBU6硬件SPI+DMA的高效WS2812B控制方法-程序员宅基地

文章浏览阅读2.3k次,点赞6次,收藏14次。SPI的详情简介不必赘述。假设我们通过SPI发送0xAA,我们的数据线就会变为10101010,通过修改不同的内容,即可修改SPI中0和1的持续时间。比如0xF0即为前半周期为高电平,后半周期为低电平的状态。在SPI的通信模式中,CPHA配置会影响该实验,下图展示了不同采样位置的SPI时序图[1]。CPOL = 0,CPHA = 1:CLK空闲状态 = 低电平,数据在下降沿采样,并在上升沿移出CPOL = 0,CPHA = 0:CLK空闲状态 = 低电平,数据在上升沿采样,并在下降沿移出。_stm32g431cbu6

计算机网络-数据链路层_接收方收到链路层数据后,使用crc检验后,余数为0,说明链路层的传输时可靠传输-程序员宅基地

文章浏览阅读1.2k次,点赞2次,收藏8次。数据链路层习题自测问题1.数据链路(即逻辑链路)与链路(即物理链路)有何区别?“电路接通了”与”数据链路接通了”的区别何在?2.数据链路层中的链路控制包括哪些功能?试讨论数据链路层做成可靠的链路层有哪些优点和缺点。3.网络适配器的作用是什么?网络适配器工作在哪一层?4.数据链路层的三个基本问题(帧定界、透明传输和差错检测)为什么都必须加以解决?5.如果在数据链路层不进行帧定界,会发生什么问题?6.PPP协议的主要特点是什么?为什么PPP不使用帧的编号?PPP适用于什么情况?为什么PPP协议不_接收方收到链路层数据后,使用crc检验后,余数为0,说明链路层的传输时可靠传输

软件测试工程师移民加拿大_无证移民,未受过软件工程师的教育(第1部分)-程序员宅基地

文章浏览阅读587次。软件测试工程师移民加拿大 无证移民,未受过软件工程师的教育(第1部分) (Undocumented Immigrant With No Education to Software Engineer(Part 1))Before I start, I want you to please bear with me on the way I write, I have very little gen...

随便推点

Thinkpad X250 secure boot failed 启动失败问题解决_安装完系统提示secureboot failure-程序员宅基地

文章浏览阅读304次。Thinkpad X250笔记本电脑,装的是FreeBSD,进入BIOS修改虚拟化配置(其后可能是误设置了安全开机),保存退出后系统无法启动,显示:secure boot failed ,把自己惊出一身冷汗,因为这台笔记本刚好还没开始做备份.....根据错误提示,到bios里面去找相关配置,在Security里面找到了Secure Boot选项,发现果然被设置为Enabled,将其修改为Disabled ,再开机,终于正常启动了。_安装完系统提示secureboot failure

C++如何做字符串分割(5种方法)_c++ 字符串分割-程序员宅基地

文章浏览阅读10w+次,点赞93次,收藏352次。1、用strtok函数进行字符串分割原型: char *strtok(char *str, const char *delim);功能:分解字符串为一组字符串。参数说明:str为要分解的字符串,delim为分隔符字符串。返回值:从str开头开始的一个个被分割的串。当没有被分割的串时则返回NULL。其它:strtok函数线程不安全,可以使用strtok_r替代。示例://借助strtok实现split#include <string.h>#include <stdio.h&_c++ 字符串分割

2013第四届蓝桥杯 C/C++本科A组 真题答案解析_2013年第四届c a组蓝桥杯省赛真题解答-程序员宅基地

文章浏览阅读2.3k次。1 .高斯日记 大数学家高斯有个好习惯:无论如何都要记日记。他的日记有个与众不同的地方,他从不注明年月日,而是用一个整数代替,比如:4210后来人们知道,那个整数就是日期,它表示那一天是高斯出生后的第几天。这或许也是个好习惯,它时时刻刻提醒着主人:日子又过去一天,还有多少时光可以用于浪费呢?高斯出生于:1777年4月30日。在高斯发现的一个重要定理的日记_2013年第四届c a组蓝桥杯省赛真题解答

基于供需算法优化的核极限学习机(KELM)分类算法-程序员宅基地

文章浏览阅读851次,点赞17次,收藏22次。摘要:本文利用供需算法对核极限学习机(KELM)进行优化,并用于分类。

metasploitable2渗透测试_metasploitable2怎么进入-程序员宅基地

文章浏览阅读1.1k次。一、系统弱密码登录1、在kali上执行命令行telnet 192.168.26.1292、Login和password都输入msfadmin3、登录成功,进入系统4、测试如下:二、MySQL弱密码登录:1、在kali上执行mysql –h 192.168.26.129 –u root2、登录成功,进入MySQL系统3、测试效果:三、PostgreSQL弱密码登录1、在Kali上执行psql -h 192.168.26.129 –U post..._metasploitable2怎么进入

Python学习之路:从入门到精通的指南_python人工智能开发从入门到精通pdf-程序员宅基地

文章浏览阅读257次。本文将为初学者提供Python学习的详细指南,从Python的历史、基础语法和数据类型到面向对象编程、模块和库的使用。通过本文,您将能够掌握Python编程的核心概念,为今后的编程学习和实践打下坚实基础。_python人工智能开发从入门到精通pdf

推荐文章

热门文章

相关标签