IplImage的结构及其读写函数_iplimage结构size cv assert-程序员宅基地

参考博客;http://blog.csdn.net/s12244315/article/details/48897765

IplImage结构

由于OpenCV主要针对的是计算机视觉方面的处理，因此在函数库中，最重要的结构体是IplImage结构。IplImage结构来源于Intel的另外一个函数库Intel Image Processing Library (IPL)，该函数库主要是针对图像处理。

IplImage结构具体定义如下：

typedef struct _IplImage

{

int nSize; /* IplImage大小 */

int ID; /* 版本 (=0)*/

int nChannels; /* 大多数OPENCV函数支持1,2,3 或 4 个通道 */

int alphaChannel; /* 被OpenCV忽略 */

int depth; /* 像素的位深度，主要有以下支持格式： IPL_DEPTH_8U, IPL_DEPTH_8S, IPL_DEPTH_16U,IPL_DEPTH_16S, IPL_DEPTH_32S,IPL_DEPTH_32F 和IPL_DEPTH_64F */

char colorModel[4]; /* 被OpenCV忽略 */

char channelSeq[4]; /* 同上 */

int dataOrder; /* 0 - 交叉存取颜色通道, 1 - 分开的颜色通道. 只有cvCreateImage可以创建交叉存取图像 */

int origin; /*图像原点位置： 0表示顶-左结构,1表示底-左结构 */

int align; /* 图像行排列方式 (4 or 8)，在 OpenCV 被忽略，使用 widthStep 代替 */

int width; /* 图像宽像素数 */

int height; /* 图像高像素数*/

struct _IplROI *roi; /* 图像感兴趣区域，当该值非空时，只对该区域进行处理 */

struct _IplImage *maskROI; /* 在 OpenCV中必须为NULL */

void *imageId; /* 同上*/

struct _IplTileInfo *tileInfo; /*同上*/

int imageSize; /* 图像数据大小(在交叉存取格式下ImageSize=image->height*image->widthStep），单位字节*/

char *imageData; /* 指向排列的图像数据 */

int widthStep; /* 排列的图像行大小，以字节为单位 */

int BorderMode[4]; /* 边际结束模式, 在 OpenCV 被忽略*/

int BorderConst[4]; /* 同上 */

char *imageDataOrigin; /* 指针指向一个不同的图像数据结构（不是必须排列的），是为了纠正图像内存分配准备的 */

} IplImage;

IplImage结构体是整个OpenCV函数库的基础，在定义该结构变量时需要用到函数cvCreatImage，变量定义方法如下：

IplImage* src="/cvCreateImage"(cvSize(400,300), IPL_DEPTH_8U,3);

上句定义了一个IplImage指针变量src，图像的大小是400×300，图像颜色深度8位，3通道图像。

重要结构元素说明：

depth和nChannels

depth代表颜色深度，使用的是以下定义的宏,nChannels是通道数，为1,2,3或4。
depth的宏定义：
IPL_DEPTH_8U,无符号8bit整数(8u)
IPL_DEPTH_8S,有符号8bit整数(8s)
IPL_DEPTH_16S,有符号16bit整数(16s)
IPL_DEPTH_32S,有符号32bit整数(32s)
IPL_DEPTH_32F,32bit浮点数，单精度(32f)

IPL_DEPTH_64F,64bit浮点数，双精度(64f)

（注：这里的颜色深度是指单个通道的数据保存为的变量类型，例如RGB24格式的数据，通道数为3，颜色深度为IPL_DEPTH_8U）

origin和dataOrder
origin变量可以有两个取值：IPL_ORIGIN_TL或者IPL_ORIGIN_BL,分别代表图像坐标系原点在左上角或是左下角。相应的，在计算机视觉领域，一个重要的错误来源就是原点位置的定义不统一。例如，图像的来源不同，操作系统不同，视频解码codec不同，存储方式不同等等，都可以造成原点位置的变化。例如，你可能认为你正在从图像上面的脸部附近取样，但实际上你却在图像下方的裙子附近取样。最初时，就应该检查一下你的系统中图像的原点位置，这可以通过在图像上方画个形状等方式实现。
dataOrder的取值可以是IPL_DATA_ORDER_PIXEL或者IPL_DATA_ORDER_PLANE,这个成员变量定义了多通道图像数据存储时颜色数据的排列方式，如果是IPL_DATA_ORDER_PIXEL,通道颜色数据排列将会是BGRBGR...的交错排列，如果是IPL_DATA_ORDER_PLANE，则每个通道的颜色值在一起，有几个通道，就有几个“颜色平面”。大多数情况下，通道颜色数据的排列是交错的。
widthStep与CvMat中的step类似，是以字节数计算的图像的宽度。成员变量imageData则保存了指向图像数据区首地址的指针。
最后还有一个重要参数roi(region of interest感兴趣的区域),这个参数是IplROI结构体类型的变量。IplROI结构体包含了xOffset,yOffset,height,width,coi成员变量，其中xOffset,yOffset是x,y坐标，coi代表channel of interest(感兴趣的通道)。有些情况下，OpenCV图像函数不是作用于整个图像，而是作用于图像的某一个部分。这时，就可以使用roi成员变量了。如果IplImage变量中设置了roi，则OpenCV函数就会使用该roi变量。如果coi被设置成非零值，则对该图像的操作就只作用于被coi指定的通道上了。不幸的是，许多OpenCV函数忽略了coi的值。

访问图像中的数据

就象访问矩阵中元素一样，我们希望用最直接的办法访问图像中的数据，例如，如果我们有一个三通道HSV图像（HSV色彩属性模式是根据色彩的三个基本属性：色相H、饱和度S和明度V来确定颜色的一种方法）,我们要将每个点的饱和度和明度设置成255，则我们可以使用指针来遍历图像，请对比一下，与矩阵的遍历有何不同：
void sat_sv( IplImage* img ) {

for( int y=0; y<height; y++ ) {
    uchar* ptr = (uchar*) (
      img->imageData + y * img->widthStep
    );
    for( int x=0; x<width; x++ ) {
      ptr[3*x+1] = 255;
      ptr[3*x+2] = 255;
    }
}
}
注意一下，3*x+1,3*x+2的方法，因为每一个点都有三个通道，所以这样设置。另外imageData成员的类型是uchar*，即字节指针类型，所以与CvMat的data指针类型(union)不同，而不需要象CvMat那样麻烦（还记得step/4,step/8的那种情形吗）。

roi和widthStep
roi和widthStep在实际工作中有很重要的作用，在很多情况下，使用它们会提高计算机视觉代码的执行速度。这是因为它们允许对图像的某一小部分进行操作，而不是对整个图像进行运算。在OpenCV中，所有的对图像操作的函数都支持roi,如果你想打开roi,可以使用函数cvSetImageROI(),并给函数传递一个矩形子窗口。而cvResetImageROI()是用于关闭roi的。
void cvSetImageROI(IplImage* image,CvRect rect);
void cvResetImageROI(IplImage* image);
注意，在程序中，一旦使用了roi做完相应的运算，就一定要用cvResetImageROI()来关闭roi,否则，其他操作执行时还会使用roi的定义。

经过多次试验，发现IplImage的使用有3种方式可以选择。

（1）iplImage = cvCreateImageHeader(cvSize(width,heigth),IPL_DEPTH_8U,1);

cvSetData(iplImage,pGrayBuffer,width*1);//第3个参数是行字节数

cvReleaseImageheader(&iplImage);

free(pGrayBuffer);//pGrayBuffer是程序里用来放灰度数据的空间，由calloc分配

（2）iplImage = cvCreateImage(cvSize(width,heigth),IPL_DEPTH_8U,1);

iplImage->imageData=pGrayBuffer;

iplImage->imageDataOrigin=pGrayBuffer;

cvReleaseImageheader(&iplImage);

free(pGrayBuffer);

(3)iplImage = cvCreateImage(cvSize(width,heigth),IPL_DEPTH_8U,1);

memcpy(iplImage->imageData,pGrayBuffer,iplImage->imageSize);

cvReleaseImage(&iplImage);

free(pGrayBuffer);

结论:这3种方式都正确，但推荐用第（1）种。总之，记住一点，如果imageData指向的空间是由cvCreateImage初始化的，那么用cvReleaseImage来释放；如果imageData指向的空间是后来用户指定的，那么用vReleaseImageheader(&iplImage);释放，并由用户自行释放分配的空间。

其实（1）cvSetData所做的事情和（2）中两句指针赋值类似。

如果分配和释放没搭配好，比如自行分配空间搭配上cvReleaseImage(&iplImage);就会出现“OpenCV ERROR: Unknown error code -49 (Deallocation error)”这类错误。

另外，补充一下，“利用cvCreateImage新建一个IplImage，之后一个个的对结构体的成员进行赋值”是非常多余的，cvCreateImage就已经根据参数中的宽度，高度，通道数，颜色深度等信息对结构体的各个成员初始化了，不需要再手动的去赋值。这里要提一下char*imageDataOrigin;这个变量的说明是指针指向一个不同的图像数据结构（不是必须排列的），是为了纠正图像内存分配准备的，实际上初始化后的imageDataOrigin和imageData指向的是同一个地址。opencv论坛上的解释是：“预留数据接口吧！上面有这么一句话：IplImage结构来自于 Intel Image Processing Library（是其本身所具有的）。OpenCV 只支持其中的一个子集。”

注：linux下的内存对齐默认是4字节，可以通过以下语句进行修改：

#progma pack(n)

常用的五个函数(I/O)
1. 图像载入函数

函数cvLoadImage载入指定图像文件，并返回指向该文件的IplImage指针。函数支持bmp、jpg、 png、 tiff等格式的图像。其函数原型如下：

IplImage* cvLoadImage( const char* filename, int iscolor);

其中，filename 是待载入图像的名称，包括图像的扩展名；iscolor是一个辅助参数项，可选正数、零和负数三种值，正数表示作为三通道图像载入，零表示该图像作为单通道图像，负数表示载入图像的通道数由图像文件自身决定。

2. 窗口定义函数

函数cvNamedWindow定义一个窗口，用于显示图像。其函数原型如下：

int cvNamedWindow( const char* name, unsigned long flags );

其中，name是窗口名，flags是窗口属性指标值，可以选择CV_WINDOW_AUTOSIZE和0两种值。CV_WINDOW_AUTOSIZE表示窗口尺寸与图像原始尺寸相同，0表示以固定的窗口尺寸显示图像。

3. 图像显示函数

函数cvShowImage是在指定的窗口中显示图像，其函数原型如下：

void cvShowImage( const char* name, const CvArr* image );

其中，name是窗口名称，image是图像类型指针，一般是IplImage指针。

4. 图像保存函数

函数cvSaveImage以指定的文件名保存IplImage类型的指针变量，其函数原型如下：

int cvSaveImage( const char* filename, const CvArr* image );

其中，filename是图像保存路径和名称，image是IplImage指针变量。

5. 图像销毁函数

函数cvReleaseImage销毁已定义的IplImage指针变量，释放占用内存空间。其函数原型如下：

void cvReleaseImage( IplImage** image );

其中，image为已定义的IplImage指针。

本文链接：https://blog.csdn.net/yyangzhenjie/article/details/77966450

原作者删帖不实内容删帖广告或垃圾文章投诉

智能推荐

java/php/node.js/python球鞋交易平台【2024年毕设】-程序员宅基地

文章浏览阅读26次。本系统带文档lw万字以上文末可领取本课题的JAVA源码参考。

U4_3 语法分析-自底向上分析-LR0/LR1/SLR分析-程序员宅基地

文章浏览阅读1.9k次，点赞67次，收藏20次。U4_3 语法分析-自底向上分析-LR0/LR1/SLR分析

夜游苏州古城-程序员宅基地

文章浏览阅读1.5k次。　　马上就要参加巅峰战将营，整理了一下，自己还真没有几套运动的衣服。只好临时抱佛脚了，跟丫头去逛街买装备。　　一整天下来，李宁、安踏逛遍，搞定3身运动装，收工！　　晚上便跟丫头来到石路万人码头乘坐游船赏月。　　游船从石路南浩街万人码头出发，沿途经过了24做桥：阊门吊桥、惠济桥、平门桥、齐门桥、糖坊湾桥、娄们桥、相门桥、葑门桥、竹辉桥、古觅渡桥、南园桥、人民桥、蟠龙桥、吴门桥、盘门、新市

Python(35):Python3 通过https上传文件和下载文件_python3 文件上传下载-程序员宅基地

文章浏览阅读1.3k次，点赞29次，收藏8次。Python(35):Python3 通过https上传文件和下载文件_python3 文件上传下载

手机远程唤醒 android,手机微信实现网络唤醒电脑(WOL)，远程开机，WakeOnLan – 全栈笔记...-程序员宅基地

文章浏览阅读5.1k次。一、需求分析我的电脑一般都是24小时候开机的，方便远程操作。但是这样，一是比较浪费电，二是对电脑硬件也或多或少有些影响。所以就需要远程开机。目前远程开机有很多种方式：1、智能插线板，可以远程控制插板的通电和断电，并在BIOS中设置来电开机，实现远程开机2、通过一些硬件，插到机箱电源跳线上来实现3、利用大部分电脑都支持的WakeOnLan技术来实现开机，只是配置过程有不少坑，相对比较麻烦。如果利用W..._wol安卓远程唤醒软件

VUE基础知识学习，零基础安装node和淘宝镜像 operation not permitted, mkdir ‘D:\nodejs\node_global‘解决方法_operation not permitted, mkdir 'd:\nodejs\node_glo-程序员宅基地

文章浏览阅读1.6k次，点赞5次，收藏2次。@VUE基础知识学习，基础安装node和淘宝镜像 operation not permitted, mkdir 'D:\nodejs\node_global’解决方法在官网上搜索node.js安装下载成功之后在本地进行安装，记得一定要去搜一下安装教程，因为有些步骤需要修改正常安装之后没有什么问题。检验npm版本（operation not permitted, mkdir 'D:\nodejs\node_global’解决方法）在这里我遇到了一个问题：发现报错，之后我就去百度上搜索了一下这个问_operation not permitted, mkdir 'd:\nodejs\node_global

随便推点

用gambit学博弈论--完全信息动态博弈（一）_gambit博弈论软件教程-程序员宅基地

文章浏览阅读1.3k次。通常用博弈的战略式表述去描述和分析静态博弈，而对动态博弈的描述和分析就借助博弈的扩展式表述。回顾第2章给出的战略式表述，其中心内容包含三个要素：(1)参与者_gambit博弈论软件教程

AI伦理：科技发展中的人性之声-程序员宅基地

文章浏览阅读1.4k次，点赞2次，收藏3次。然而，随着AI技术的快速发展，我们也面临着一系列伦理问题，这些问题涉及到我们的隐私、公平性、自主性和责任等方面。通过建立法律框架、改进训练数据和算法、提高模型的可解释性以及提供伦理培训，我们可以更好地应对AI伦理挑战，为科技发展中的人性之声提供指导。：为了解决数据收集和滥用问题，需要制定严格的数据隐私法规，确保个人数据的收集和使用受到适当的监管。：为了解决自主性问题，需要建立法律框架，明确自主AI系统的责任和法律责任。为了应对伦理挑战，开发人员和数据科学家需要受到伦理教育，以提高他们的伦理意识和决策能力。

shell之三剑客awk（基础用法）-程序员宅基地

文章浏览阅读3.6w次，点赞89次，收藏623次。AWK是一种处理文本文件的语言，是一个强大的文件分析工具。它是专门为文本处理设计的编程语言，也是行处理软件，通常用于扫描，过滤，统计汇总等工作，数据可以来自标准输入也可以是管道或文件。当读到第一行时，匹配条件，然后执行指定动作，在接着读取第二行数据处理，不会默认输出。如果没有定义匹配条件，则是默认匹配所有数据行，awk隐含循环，条件匹配多少次，动作就会执行多少次。逐行读取文本，默认以空格或tab键为分割符进行分割，将分割所得的各个字段，保存到内建变量中，并按模式或或条件执行编辑命令。与sed工作原理相比：s_awk