Tensorflow入门--------计算卷积后的特征图尺寸_三维卷积后的尺寸怎么计算-程序员宅基地

在卷积神经网络设计网型的时候，需要对卷积核和池化层进行参数设置。有三个重要的参数，首先是卷积核的大小，其次是设置步长（padding）的大小，最后是是否采用padding。这几个因素直接影响了卷积、池化后的特征图的大小，对于网络形状的设计非常重要的参数。本博客将针对这三个参数进行解释，并且利用tensorflow进行结论的实验。

一、卷积核

卷积核这个东西比较好理解，就是卷积滤波器的大小，当然，卷积核也可能是三维的。卷积的过程如如图2所示，其中的卷积核是3*3的卷积。三维卷积的形状如图1。

图1 三维卷积

二、步长（stride）

所谓的步长就是卷积核在原始图像上每一次移动的步数，如图2所示该卷积操作的步长为1，步长用stride来表示。

图2 卷积操作的过程

三、填充（padding）

当我们用一个卷积核去和一个影像进行卷积操作的时候，我们可以发现，不同位置的像素利用率是不同的，例如位于图像中心的像素，它参与了多次的卷积运算，对整个卷积过程的贡献大。但是想图像四个角的像素只参与了以此的卷积运算，贡献就被忽略了。另外，由于卷积操作，使得原始图像的大小不断地减小。为了避免上述的两个问题，我们采用填充的方式，就是在原始图像的四周再添加一圈像素值，这样就能够保证每一个原始图像的像素都参与相同贡献的卷积操作。

从图中可以看出，蓝色的原始影像进行了一个像素的padding操作，这样就使得位于角点的像素也能参与更多的卷积过程。

四、卷积后特征图大小的计算。参考博客卷积后图像大小计算

1.卷积后尺寸计算
out_height=(in_height+2pad-filter_height)/strides[1]+1
out_width=(in_width+2pad-filter_width)/strides[2] +1
2.tensorflow中卷积参数same和valid运算之后的维度计算
(1)same
out_height=ceil(float(in_height))/float(strides[1])
out_width=ceil(float(in_width))/float(strides[2])
(2)valid
out_height=ceil(float(in_height-filter_height+1))/float(strides[1])
out_width=ceil(float(in_width-filter_width+1))/float(strides[2])
(3)参数
padding: SAME和VALID两种形式
filter: [5,5,1,32]表示5*5的卷积核，1个channel，32个卷积核。
strides: [1,4,4,1]表示横向和竖向的步长都为4

五、实验

利用tensorflow进行实际的实验操作。实验的源代码如下：

# -*- coding: utf-8 -*-
import tensorflow as tf
import numpy as np 
"""
Created on Tue Jul 17 10:03:21 2018

@author: C.H.
"""
tf.reset_default_graph()#这一句话非常重要，如果没有这句话，就会出现重复定义变量的错误
x = tf.placeholder(tf.float32, shape=(1, 500, 500, 3))
#分别设置3*3,5*5,7*7三种大小的卷积核
weights1 = tf.get_variable('weights1',shape=[3, 3, 3, 16],dtype=tf.float32,initializer=tf.truncated_normal_initializer(stddev=0.1, dtype=tf.float32))
weights2 = tf.get_variable('weights2',shape=[5, 5, 3, 16],dtype=tf.float32,initializer=tf.truncated_normal_initializer(stddev=0.1, dtype=tf.float32))
weights3 = tf.get_variable('weights3',shape=[7, 7, 3, 16],dtype=tf.float32,initializer=tf.truncated_normal_initializer(stddev=0.1, dtype=tf.float32))
#第一组实验采用步长为1，填充采用SAME，然后采用三种不同大小的卷积核来进行实验，讨论卷积核对卷积后图像大小的影响。第一组实验为其他实验的对照组
conv1 = tf.nn.conv2d(x, weights1, strides=[1, 1, 1, 1], padding='SAME')
conv2 = tf.nn.conv2d(x, weights2, strides=[1, 1, 1, 1], padding='SAME')
conv3 = tf.nn.conv2d(x, weights3, strides=[1, 1, 1, 1], padding='SAME')
#第二组实验，控制卷积核的大小为3*3，分别采用1,2,3三种步长，padding方式采用SAME，讨论步长对卷积后图像大小的影响。
conv4 = tf.nn.conv2d(x, weights1, strides=[1, 1, 1, 1], padding='SAME')
conv5 = tf.nn.conv2d(x, weights1, strides=[1, 2, 2, 1], padding='SAME')
conv6 = tf.nn.conv2d(x, weights1, strides=[1, 3, 3, 1], padding='SAME')
#第三组实验，与第一组实验对照，选择和第一组实验相同的卷积核大小和步长，采用padding的填充方式进行测试。讨论不同padding方式对卷积后图像的影响
conv7 = tf.nn.conv2d(x, weights1, strides=[1, 1, 1, 1], padding='VALID')
conv8 = tf.nn.conv2d(x, weights2, strides=[1, 1, 1, 1], padding='VALID')
conv9 = tf.nn.conv2d(x, weights3, strides=[1, 1, 1, 1], padding='VALID')
#池化过程的'VALID'，'SAME'参数的对照。讨论不同参数设置对最大池化过程后图像大小的影响
pool1 = tf.nn.max_pool(x, [1, 3, 3, 1], [1, 3, 3, 1], padding = 'VALID')
pool2 = tf.nn.max_pool(x, [1, 3, 3, 1], [1, 3, 3, 1], padding = 'SAME')

with tf.Session() as sess: 
    a =  np.full((1, 500, 500, 3), 2)
    sess.run(tf.global_variables_initializer())
    conv1= sess.run(conv1,feed_dict={x: a})
    conv2= sess.run(conv2,feed_dict={x: a})
    conv3= sess.run(conv3,feed_dict={x: a})
    conv4= sess.run(conv4,feed_dict={x: a})
    conv5= sess.run(conv5,feed_dict={x: a})
    conv6= sess.run(conv6,feed_dict={x: a})
    conv7= sess.run(conv7,feed_dict={x: a})
    conv8= sess.run(conv8,feed_dict={x: a})
    conv9= sess.run(conv9,feed_dict={x: a})
    pool1= sess.run(pool1,feed_dict={x: a})
    pool2= sess.run(pool2,feed_dict={x: a})
    print(conv1.shape)
    print(conv2.shape)  
    print(conv3.shape)  
    print(conv4.shape)  
    print(conv5.shape)  
    print(conv6.shape)  
    print(conv7.shape)  
    print(conv8.shape)  
    print(conv9.shape)  
    print(pool1.shape)  
    print(pool2.shape)

实验的结果如下：

runfile('E:/Study/研究生文档/深度学习资料/深度学习程序/computeshapeafterconv.py', wdir='E:/Study/研究生文档/深度学习资料/深度学习程序')
(1, 500, 500, 16)#out=ceil(float(in))/float(strides) 
(1, 500, 500, 16)#out=ceil(float(in))/float(strides) 
(1, 500, 500, 16)#out=ceil(float(in))/float(strides) 
(1, 500, 500, 16)#out=ceil(float(in))/float(strides) 
(1, 250, 250, 16)#out=ceil(float(in))/float(strides) 
(1, 167, 167, 16)#out=ceil(float(in))/float(strides) 
(1, 498, 498, 16)#out=ceil(float(in-filter+1))/float(strides) 
(1, 496, 496, 16)#out=ceil(float(in-filter+1))/float(strides) 
(1, 494, 494, 16)#out=ceil(float(in-filter+1))/float(strides) 
(1, 166, 166, 3)#out=floor(float(in))/float(strides)
(1, 167, 167, 3)#out=ceil(float(in))/float(strides)

另外，在程序中出现了两个需要注意的语句。

tf.reset_default_graph()#这一句话非常重要，如果没有这句话，就会出现重复定义变量的错误

这句话如果没有加在程序的最开始，那么如果你想进行多次程序的运行和调试的时候，程序就会报错。

ValueError: Variable weights1 already exists, disallowed. Did you mean to set reuse=True or reuse=tf.AUTO_REUSE in VarScope? Originally defined at:

  File "D:\Anaconda3-5.0.1-Windows-x86_64\RESULT\envs\tensorflow\lib\site-packages\tensorflow\python\framework\ops.py", line 1625, in __init__
    self._traceback = self._graph._extract_stack()  # pylint: disable=protected-access
  File "D:\Anaconda3-5.0.1-Windows-x86_64\RESULT\envs\tensorflow\lib\site-packages\tensorflow\python\framework\ops.py", line 3160, in create_op
    op_def=op_def)
  File "D:\Anaconda3-5.0.1-Windows-x86_64\RESULT\envs\tensorflow\lib\site-packages\tensorflow\python\framework\op_def_library.py", line 787, in _apply_op_helper
    op_def=op_def)

错误的原因是第一次运行程序的时候，计算图中已经存在所有定义的变量，如果再运行程序，就会重复定义变量。加上重置计算图那个语句就搞定了。

第二个需要注意的地方

conv1= sess.run(conv1,feed_dict={x: a})

在这里将numpy变量a，feed给变量x的时候，每次只能feed一个变量。不能出现下面的写法。

conv1,conv2= sess.run(conv1,conv2,feed_dict={x: a})

如果这样的话就会出现以下错误：

TypeError: run() got multiple values for argument 'feed_dict'

总结，这篇博客讨论了卷积运算操作时候的三个重要的参数，卷积核大小，步长大小和填充大小。分别进行了对照试验，验证了总结的经验公式。这种基础操作为网络设计和控制输出tensor大小做了必要的准备。

本文链接：https://blog.csdn.net/qq_32466233/article/details/81075288

原作者删帖不实内容删帖广告或垃圾文章投诉

智能推荐

c# 调用c++ lib静态库_c#调用lib-程序员宅基地

文章浏览阅读2w次，点赞7次，收藏51次。四个步骤1.创建C++ Win32项目动态库dll 2.在Win32项目动态库中添加外部依赖项 lib头文件和lib库3.导出C接口4.c#调用c++动态库开始你的表演...①创建一个空白的解决方案，在解决方案中添加 Visual C++ , Win32 项目空白解决方案的创建：添加Visual C++ , Win32 项目这......_c#调用lib

deepin/ubuntu安装苹方字体-程序员宅基地

文章浏览阅读4.6k次。苹方字体是苹果系统上的黑体，挺好看的。注重颜值的网站都会使用，例如知乎：font-family: -apple-system, BlinkMacSystemFont, Helvetica Neue, PingFang SC, Microsoft YaHei, Source Han Sans SC, Noto Sans CJK SC, W..._ubuntu pingfang

html表单常见操作汇总_html表单的处理程序有那些-程序员宅基地

文章浏览阅读159次。表单表单概述表单标签表单域按钮控件demo表单标签表单标签基本语法结构<form action="处理数据程序的url地址“ method=”get|post“ name="表单名称”></form><!--method将表单中的数据传送给服务器处理，get方式直接显示在url地址中，数据可以被缓存，且长度有限制；而post方式数据隐藏传输，_html表单的处理程序有那些

PHP设置谷歌验证器（Google Authenticator）实现操作二步验证_php otp 验证器-程序员宅基地

文章浏览阅读1.2k次。使用说明:开启Google的登陆二步验证（即Google Authenticator服务）后用户登陆时需要输入额外由手机客户端生成的一次性密码。实现Google Authenticator功能需要服务器端和客户端的支持。服务器端负责密钥的生成、验证一次性密码是否正确。客户端记录密钥后生成一次性密码。下载谷歌验证类库文件放到项目合适位置(我这边放在项目Vender下面)https://github.com/PHPGangsta/GoogleAuthenticatorPHP代码示例://引入谷_php otp 验证器

【Python】matplotlib.plot画图横坐标混乱及间隔处理_matplotlib更改横轴间距-程序员宅基地

文章浏览阅读4.3k次，点赞5次，收藏11次。matplotlib.plot画图横坐标混乱及间隔处理_matplotlib更改横轴间距

docker — 容器存储_docker 保存容器-程序员宅基地

文章浏览阅读2.2k次。①Storage driver 处理各镜像层及容器层的处理细节，实现了多层数据的堆叠，为用户提供了多层数据合并后的统一视图②所有 Storage driver 都使用可堆叠图像层和写时复制（CoW）策略③docker info 命令可查看当系统上的 storage driver主要用于测试目的，不建议用于生成环境。_docker 保存容器

随便推点

网络拓扑结构_网络拓扑csdn-程序员宅基地

文章浏览阅读834次，点赞27次，收藏13次。网络拓扑结构是指计算机网络中各组件（如计算机、服务器、打印机、路由器、交换机等设备）及其连接线路在物理布局或逻辑构型上的排列形式。这种布局不仅描述了设备间的实际物理连接方式，也决定了数据在网络中流动的路径和方式。不同的网络拓扑结构影响着网络的性能、可靠性、可扩展性及管理维护的难易程度。_网络拓扑csdn

JS重写Date函数，兼容IOS系统_date.prototype 将所有 ios-程序员宅基地

文章浏览阅读1.8k次，点赞5次，收藏8次。IOS系统Date的坑要创建一个指定时间的new Date对象时，通常的做法是：new Date("2020-09-21 11:11:00")这行代码在 PC 端和安卓端都是正常的，而在 iOS 端则会提示 Invalid Date 无效日期。在IOS年月日中间的横岗许换成斜杠，也就是new Date("2020/09/21 11:11:00")通常为了兼容IOS的这个坑，需要做一些额外的特殊处理，笔者在开发的时候经常会忘了兼容IOS系统。所以就想试着重写Date函数，一劳永逸，避免每次ne_date.prototype 将所有 ios