基于内容的图像检索软件库LIRE的特征提取方法综述_lucene image retrieval-程序员宅基地

技术标签: FCTH  Java编程  LIRE  图像检索  CBIR  CEDD  

LIRE(Lucene Image Retrieval ) 是利用Apache Lucene 建立索引进行图像检索的开源软件库。该软件项目的网址是 http://lire-project.net。LIRE这个软件库可以很方便地建立Lucene索引进行基于内容的图像检索 (CBIR, content based image retrieval ),该库为检索提供了丰富的图像特征提取方法。这里提醒大家一下,如果使用LIRE时你要用Lucene 建立索引,请注意Lucene版本兼容问题。本文对LIRE 特征提取方法做简介,不介绍LIRE其他方面。

 

1 全局特征

LIRE源码解压后,在src\main\java\net\semanticmetadata\lire\imageanalysis\features路径下有global文件夹,里面有20个全局特征提取方法。

 

1.1 ACCID

ACCID特征的目的是寻找不同尺度下最重要的边缘特征,然后把它们和使用 CEDD描述子得到的模糊色彩方案一起储存在一个直方图里。

1.2 AutoColorCorrelogram

AutoCorrelogram特征基于颜色,算法参考Huang, J.; Kumar, S. R.; Mitra, M.; Zhu, W. & Zabih, R. (2007) "Image Indexing Using Color Correlograms", IEEE Computer Society. DOI: 10.1109/CVPR.1997.609412。一个颜色相关图(color correlogram) 是一个用颜色和像素间距离建立索引的三维数据表。它代表了一个图像中,颜色改变的空间相关性是如何随距离变化的。

1.3 BinaryPatternsPyramid

BinaryPatternsPyramid和PHOG一样,但PHOG是以方向渐变来量度,而这里用的是旋转不变性的局部二值模式(LBP, Local binary patterns)的直方图。

1.4 CEDD

 CEDD是颜色和边缘方向性描述子,将图像的颜色和边缘方向性信息结合起来生成一个144字节的直方图。关于CEDD的更多知识可以参考 Savvas A. Chatzichristofis and Yiannis S. Boutalis, CEDD: Color and Edge Directivity Descriptor. A Compact Descriptor for Image Indexing and Retrieval, A. Gasteratos, M. Vincze, and J.K. Tsotsos (Eds.): ICVS 2008, LNCS 5008, pp. 312-322, 2008.

1.5 ColorLayout

ColorLayout是MPEG-7多媒体标准描述子中一种高效的颜色特征描述子。通过图像分割、代表颜色选择、离散余弦变换(DCT, Discrete Cosine Transform)、Z字形扫描四个步骤得到特征描述子。(用于CEDD)

1.6 EdgeHistogram

EdgeHistogram是MPEG-7多媒体标准描述子中一种高效的边缘特征描述子。用一个40个字节的数组构成一个边缘直方图描述子。通过图像分割、计算子图边缘直方图、归一化、计算图像边缘直方图等步骤得到特征描述子。(用于CEDD)

1.7 FCTH

FCTH是模糊颜色和纹理直方图特征。它从3个模糊单元的组合求得。先将图像分割,然后用两个模糊单元产生模糊颜色直方图,再在第三个模糊单元中将子图经小波变换生成模糊纹理直方图,最后模糊颜色直方图和模糊纹理直方图结合得到FCTH特征描述子。更多信息请参考:Savvas A. Chatzichristofis and Yiannis S. Boutalis, FCTH: Fuzzy Color and Texture Histogram - A Low Level Feature for Accurate Image Retrieval, in Proceedings of the Ninth International Workshop on Image Analysis for Multimedia Interactive Services, IEEE, Klagenfurt, May, 2008.

1.8 FuzzyColorHistogram 

FuzzyColorHistogram是一种模糊颜色直方图特征。传统颜色直方图对噪音敏感。模糊颜色直方图通过模糊算法产生模糊颜色直方图。

1.9 FuzzyOpponentHistogram

 FuzzyOpponentHistogram是基于对色(对手颜色)空间的简单的模糊64-bin(维)对色直方图。更多信息参考Sande K E A V D , Gevers T , Snoek C G M . Evaluating color descriptors for object and scene recognition. IEEE Trans Pattern Anal Mach Intell[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2010, 32(9):1582-1596.

1.10 Gabor

Gabor纹理特征通过对图像与gabor滤波器做卷积而得到,gabor滤波器定义为高斯函数与正弦函数的乘积。Gabor特征提取模拟了人类视觉刺激响应,广泛应用于视觉信息理解,例如人脸识别。

1.11 JCD

 JCD特征将CEDD和FCTH结合在一个直方图里面。

1.12 JpegCoefficientHistogram

JpegCoefficientHistogram是JPEG 系数直方图特征。将图像分块,然后求离散余弦变换(DCT,Discrete Cosine Transform。JPEG图像压缩时要做DCT变换),计算DCT系数矩阵,再从得到的差分DCT系数矩阵求得直方图。适用于JPEG图像检索。

1.13 LocalBinaryPatterns

LocalBinaryPatterns是原始的局部二值模式特征。在图像每个3*3像素块中,以中心像素为阈值,将相邻的8个像素的灰度值与其进行比较,大于中心像素值的像素点标记为1,反之为0,中心点周围8个点经比较产生8位二进制数,将其转换为十进制数作为中心像素点的LBP值,以此来反映该区域的纹理信息。

1.14 LuminanceLayout

LuminanceLayout描述子用于灰度或黑白图像。它将图像缩小到很小然后将它作为描述子。

1.15 OpponentHistogram

简单的64-bin(维)对色直方图,基于对色空间。参见1.9。

1.16 PHOG

PHOG描述子大体上就是将几个空间金字塔中不同层(可理解为图像缩小到不同分辨率)的边缘直方图结合在一起。更多信息参考 Anna Bosch, Andrew Zisserman & Xavier Munoz (2007) "Representing shape with a spatial pyramid kernel", CVIR 2007.

1.17 RotationInvariantLocalBinaryPatterns

一个简单的具有旋转不变性的局部二值模式特征。

1.18 ScalableColor

ScalableColor是MPEG-7 Scalable Color使用LireFeature的一个打包。可伸缩颜色描述符(Scalable Color Descriptor)是MPEG-7标准中颜色描述符的一种。它是固定于HSV空间的颜色直方图,用Haar变化编码,针对不同需求可改变尺寸。更多信息可参考:李志全, 黎建辉, 阎保平. MPEG-7可伸缩颜色描述符的研究[J]. 中国科学院大学学报, 2006, 23(2):192-197.

1.19 SimpleColorHistogram

SimpleColorHistogram提供一个简单的RGB颜色直方图,用于基于内容的图像检索。在LIRE的SimpleColorHistogram中,维数是可配置的,直方图归一化到每维8位。

1.20 Tamura

Tamura特征由Tamura提出,用粗糙度、对比度、方向度、 线像度、规整度和粗略度六个分量对应于心理学角度上纹理特征的六种属性。前三种最重要,所以LIRE的Tamura特征用前三个分量来实现。

 

2 局部特征

LIRE局部特征描述子包括:Simple、SelfSimilarities、Shapecontext、Sift、Surf。源码在src\main\java\net\semanticmetadata\lire\imageanalysis\features路径下local文件夹中。

2.1 Simple

Simple特征基于论文:Anagnostopoulos N , Boutalis Y , Kapoutsis A C , et al. Searching Images with MPEG-7 (& MPEG-7-like) Powered Localized dEscriptors: The SIMPLE answer to effective Content Based Image Retrieval[C]// International Workshop on Content-based Multimedia Indexing. IEEE, 2014。论文中,作者使用SURF检测子定义团状纹理突出部分,用MPEG-7 可伸缩颜色 Scalable Color ,颜色布局Color Layout以及边缘直方图Edge Histogram描述子以及CEDD来产生最终的局部特征描述子。

2.2 SelfSimilarities

SelfSimilarities特征基于论文:Chatfield K , Philbin J , Zisserman A . Efficient retrieval of deformable shape classes using local self-similarities[C]// IEEE International Conference on Computer Vision Workshops. IEEE Xplore, 2009。论文中,作者表示该特征描述子可用于快速检索图像,即使目标图像中物体缩放、图像颜色纹理发生变化、位置变化。此外,该特征对物体非刚性变形的鲁棒性也很好。

2.3 Shapecontext

Shapecontext特征基于论文: S. Belongie, J. Malik, and J. Puzicha, "Shape Matching and Object Recognition Using Shape Contexts," IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 24, no. 4, pp. 509-522, Apr. 2002。论文作者用新方法测量形状之间的相似性并将其用于物体识别。在该框架中,形状相似性量度通过两个步骤进行1)求两个形状间对应点;2)用这些对应来估算对准后的形变。为解决对应的问题,设计了shape context(形状上下文)描述子。这个shape context是一个参考点,它是周围余下点相对于它的分布。相对应的点会有近似的shape context。这样,两个相似的形状的对应点会有相似的shape context。

2.4 Sift

Sift是尺度不变特征变换(Scale-invariant feature transform)。它用不同尺度(标准差)的高斯函数对图像进行平滑,平滑后图像变化差别大的像素就是特征明显的点。 它对旋转、缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声也保持一定程度的鲁棒性。网上资料较多,大家也比较熟悉,这里不多说了。

2.3 Surf

Surf (Speeded Up Robust Features) 比SIFT要快数倍,而且其作者声称在不同图像变换方面比Sift更加稳健。Hessian矩阵是SURF算法的核心。Surf网上资料也很多,这里不多说了。

3 总结

LIRE提供的特征描述子中,ColorLayout、 ScalableColor是MPEG-7标准中颜色描述子中的其中两种;SimpleColorHistogram是经典的颜色直方图,OpponentHistogram是基于对色空间的直方图;FuzzyColorHistogram、FuzzyOpponentHistogram利用模糊算法处理减少噪音对Color Histogram、Opponent Histogram的干扰。LuminanceLayout是简单快速的明暗特征,AutoColorCorrelogram颜色改变随距离变化的空间相关性特征,这些都是属于图像的颜色特征描述。

EdgeHistogram是基本的边缘直方图特征, LocalBinaryPatterns是原始的局部二值模式特征,RotationInvariantLocalBinaryPatterns是旋转不变的局部二值模式;PHOG是图像不同分辨率下边缘直方图的结合(以方向渐变来量度),BinaryPatternsPyramid与PHOG不同的地方是使用旋转不变性的局部二值模式的直方图。这几个都是图像纹理特征的描述子。

CEDD把图像的颜色和边缘方向性信息结合起来生成直方图。ACCID把不同尺度下最重要的边缘特征,与使用 CEDD描述子得到的模糊色彩方案一起储存在一个直方图里。FCTH是颜色和纹理直方图模糊处理再结合的;JCD则把CEDD和FCTH联合在一起。

JpegCoefficientHistogram是JPEG 系数直方图特征,适用于JPEG压缩的图片。

    Gabor纹理特征模拟了人类视觉刺激响应,广泛应用于视觉信息理解

Tamura用对应于心理学角度上纹理:特征粗糙度、对比度、方向度来进行图像纹理特征描述。

LIRE提供的局部特征描述子中Sift、Surf是最为人所知的。Simple是Surf、Scalable Color、Color Layout、Edge Histogram、CEDD等多种特征的综合。SelfSimilarities和Shapecontext是检测图像局部形状的特征。

LIRE提供的这些特征描述子各具特色,在不同的基于内容的图像检索应用中,需根据具体的需要进行选择,很显然一个基于内容的图像检索如果结合考虑了颜色、纹理和形状特征是会提高精确性的。结合不同特征时还应考虑速度、精确性(precision)和召回率(recall)。即使综合应用多种特征,往往也难以达到很高的精确性。为了提高精确性,可以对大样本提取特征再聚类分析后获取更具代表性的特征用于检索,甚至通过人工神经网(ANN)和支持向量机(SVM)等监督学习方法对大量样本进行训练建模来提高检索的精确性,但这在速度上肯定是收到很大影响的。

 

希望对LIRE了解更多的可以参考以下文献:

  1. Lux Mathias, Savvas A. Chatzichristofis. Lire: Lucene Image Retrieval- An Extensible Java CBIR Library. In proceedings of the 16th ACM International Conference on Multimedia, pp. 1085-1088, Vancouver, Canada, 2008. http://doi.acm.org/10.1145/1459359.1459577

[2]Lux Mathias. Content Based Image Retrieval with LIRE. In proceedings of the 19th ACM International Conference on Multimedia, pp. 735-738, Scottsdale, Arizona, USA, 2011. http://dl.acm.org/citation.cfm?id=2072432

[3]Mathias Lux, Oge Marques. Visual Information Retrieval using Java and LIRE. Morgan & Claypool, 2013. http://www.morganclaypool.com/doi/abs/10.2200/S00468ED1V01Y201301ICR025

 

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/netscaner/article/details/99720381

智能推荐

leetcode 172. 阶乘后的零-程序员宅基地

文章浏览阅读63次。题目给定一个整数 n,返回 n! 结果尾数中零的数量。解题思路每个0都是由2 * 5得来的,相当于要求n!分解成质因子后2 * 5的数目,由于n中2的数目肯定是要大于5的数目,所以我们只需要求出n!中5的数目。C++代码class Solution {public: int trailingZeroes(int n) { ...

Day15-【Java SE进阶】IO流(一):File、IO流概述、File文件对象的创建、字节输入输出流FileInputStream FileoutputStream、释放资源。_outputstream释放-程序员宅基地

文章浏览阅读992次,点赞27次,收藏15次。UTF-8是Unicode字符集的一种编码方案,采取可变长编码方案,共分四个长度区:1个字节,2个字节,3个字节,4个字节。文件字节输入流:每次读取多个字节到字节数组中去,返回读取的字节数量,读取完毕会返回-1。注意1:字符编码时使用的字符集,和解码时使用的字符集必须一致,否则会出现乱码。定义一个与文件一样大的字节数组,一次性读取完文件的全部字节。UTF-8字符集:汉字占3个字节,英文、数字占1个字节。GBK字符集:汉字占2个字节,英文、数字占1个字节。GBK规定:汉字的第一个字节的第一位必须是1。_outputstream释放

jeecgboot重新登录_jeecg 登录自动退出-程序员宅基地

文章浏览阅读1.8k次,点赞3次,收藏3次。解决jeecgboot每次登录进去都会弹出请重新登录问题,在utils文件下找到request.js文件注释这段代码即可_jeecg 登录自动退出

数据中心供配电系统负荷计算实例分析-程序员宅基地

文章浏览阅读3.4k次。我国目前普遍采用需要系数法和二项式系数法确定用电设备的负荷,其中需要系数法是国际上普遍采用的确定计算负荷的方法,最为简便;而二项式系数法在确定设备台数较少且各台设备容量差..._数据中心用电负荷统计变压器

HTML5期末大作业:网页制作代码 网站设计——人电影网站(5页) HTML+CSS+JavaScript 学生DW网页设计作业成品 dreamweaver作业静态HTML网页设计模板_网页设计成品百度网盘-程序员宅基地

文章浏览阅读7k次,点赞4次,收藏46次。HTML5期末大作业:网页制作代码 网站设计——人电影网站(5页) HTML+CSS+JavaScript 学生DW网页设计作业成品 dreamweaver作业静态HTML网页设计模板常见网页设计作业题材有 个人、 美食、 公司、 学校、 旅游、 电商、 宠物、 电器、 茶叶、 家居、 酒店、 舞蹈、 动漫、 明星、 服装、 体育、 化妆品、 物流、 环保、 书籍、 婚纱、 军事、 游戏、 节日、 戒烟、 电影、 摄影、 文化、 家乡、 鲜花、 礼品、 汽车、 其他 等网页设计题目, A+水平作业_网页设计成品百度网盘

【Jailhouse 文章】Look Mum, no VM Exits_jailhouse sr-iov-程序员宅基地

文章浏览阅读392次。jailhouse 文章翻译,Look Mum, no VM Exits!_jailhouse sr-iov

随便推点

chatgpt赋能python:Python怎么删除文件中的某一行_python 删除文件特定几行-程序员宅基地

文章浏览阅读751次。本文由chatgpt生成,文章没有在chatgpt生成的基础上进行任何的修改。以上只是chatgpt能力的冰山一角。作为通用的Aigc大模型,只是展现它原本的实力。对于颠覆工作方式的ChatGPT,应该选择拥抱而不是抗拒,未来属于“会用”AI的人。AI职场汇报智能办公文案写作效率提升教程 专注于AI+职场+办公方向。下图是课程的整体大纲下图是AI职场汇报智能办公文案写作效率提升教程中用到的ai工具。_python 删除文件特定几行

Java过滤特殊字符的正则表达式_java正则表达式过滤特殊字符-程序员宅基地

文章浏览阅读2.1k次。【代码】Java过滤特殊字符的正则表达式。_java正则表达式过滤特殊字符

CSS中设置背景的7个属性及简写background注意点_background设置背景图片-程序员宅基地

文章浏览阅读5.7k次,点赞4次,收藏17次。css中背景的设置至关重要,也是一个难点,因为属性众多,对应的属性值也比较多,这里详细的列举了背景相关的7个属性及对应的属性值,并附上演示代码,后期要用的话,可以随时查看,那我们坐稳开车了······1: background-color 设置背景颜色2:background-image来设置背景图片- 语法:background-image:url(相对路径);-可以同时为一个元素指定背景颜色和背景图片,这样背景颜色将会作为背景图片的底色,一般情况下设置背景..._background设置背景图片

Win10 安装系统跳过创建用户,直接启用 Administrator_windows10msoobe进程-程序员宅基地

文章浏览阅读2.6k次,点赞2次,收藏8次。Win10 安装系统跳过创建用户,直接启用 Administrator_windows10msoobe进程

PyCharm2021安装教程-程序员宅基地

文章浏览阅读10w+次,点赞653次,收藏3k次。Windows安装pycharm教程新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入下载安装PyCharm1、进入官网PyCharm的下载地址:http://www.jetbrains.com/pycharm/downl_pycharm2021

《跨境电商——速卖通搜索排名规则解析与SEO技术》一一1.1 初识速卖通的搜索引擎...-程序员宅基地

文章浏览阅读835次。本节书摘来自异步社区出版社《跨境电商——速卖通搜索排名规则解析与SEO技术》一书中的第1章,第1.1节,作者: 冯晓宁,更多章节内容可以访问云栖社区“异步社区”公众号查看。1.1 初识速卖通的搜索引擎1.1.1 初识速卖通搜索作为速卖通卖家都应该知道,速卖通经常被视为“国际版的淘宝”。那么请想一下,普通消费者在淘宝网上购买商品的时候,他的行为应该..._跨境电商 速卖通搜索排名规则解析与seo技术 pdf

推荐文章

热门文章

相关标签