技术标签: python识别图片对象
介绍
对象检测是一种属于计算机视觉领域的技术。它处理识别和跟踪图像和视频中存在的对象。物体检测具有多种应用,例如面部检测,车辆检测,行人计数,自动驾驶汽车,安全系统等。
对象检测的两个主要目标包括:
识别图像中存在的所有对象
筛选出关注的对象
在本文中,您将看到如何在Python中执行对象检测。
用于对象检测的深度学习
深度学习技术已被证明可解决各种物体检测问题。
我们将了解ImageAI的确切含义以及如何使用它执行对象检测。
图像AI
ImageAI是一个Python库,旨在使开发人员能够使用几行简单的代码来构建具有独立的深度学习和计算机视觉功能的应用程序和系统。ImageAI包含Python实现的几乎所有最新的深度学习算法,例如TinyYOLOv3。
ImageAI利用了几种脱机工作的API-它具有对象检测,视频检测和对象跟踪API,无需访问互联网即可调用它们。ImageAI利用了预先训练的模型,可以轻松地进行定制。
设置环境
要使用ImageAI,您需要安装一些依赖项。第一步是在计算机上安装Python。
TensorFlow
$ pip install tensorflow
OpenCV
$ pip install opencv-python
$ pip install keras
$ pip install imageAI
现在下载TinyYOLOv3模型文件,该文件包含将用于对象检测的分类模型。
使用ImageAI执行对象检测
现在,让我们看看如何实际使用ImageAI库。我将逐步解释如何使用ImageAI构建第一个对象检测模型。
第1步
我们的第一个任务是创建必要的文件夹。对于本教程,我们需要以下文件夹:
对象检测:根文件夹
模型:存储预先训练的模型
输入:存储要在其上执行对象检测的图像文件
输出:存储带有检测到的对象的图像文件
创建文件夹后,Object detection文件夹应包含以下子文件夹:
├── input
├── models
└── output
3 directories, 0 files
第2步
打开用于编写Python代码的首选文本编辑器,然后创建一个新文件detector.py。
第三步
ObjectDetection从ImageAI库导入类。
from imageai.Detection import ObjectDetection
第四步
现在,您已经导入了imageAI库和ObjectDetection该类,下一步是创建该类的实例ObjectDetection,如下所示:
detector = ObjectDetection()
第5步
让我们从输入图像,输出图像和模型指定路径。
model_path = "./models/yolo-tiny.h5"
input_path = "./input/test45.jpg"
output_path = "./output/newimage.jpg"
第6步
我们现在可以从该类中调用各种函数。该类包含以下功能调用预先训练模式:setModelTypeAsRetinaNet(),setModelTypeAsYOLOv3(),和setModelTypeAsTinyYOLOv3()。
就本教程而言,我将使用预训练的TinyYOLOv3模型,因此,我们将使用该setModelTypeAsTinyYOLOv3()函数加载模型。
detector.setModelTypeAsTinyYOLOv3()
步骤7
接下来,我们将调用函数setModelPath()。此函数接受一个字符串,其中包含预训练模型的路径:
detector.setModelPath(model_path)
步骤8
此步骤loadModel()从detector实例中调用函数。它使用setModelPath()类方法从上面指定的路径加载模型。
detector.loadModel()
步骤9
要检测图像中的对象,我们需要detectObjectsFromImage使用detector在上一节中创建的对象来调用函数。
此函数需要两个参数:input_image和output_image_path。input_image是我们正在检测的图像所在的路径,而output_image_path参数是将图像与检测到的对象一起存储的路径。此函数返回一个字典,其中包含图像中检测到的所有对象的名称和百分比概率。
detection = detector.detectObjectsFromImage(input_image=input_path, output_image_path=output_path)
第10步
可以通过遍历字典中的每个项目来访问字典项目。
for eachItem in detection:
print(eachItem["name"] , " : ", eachItem["percentage_probability"])
在输出中,您可以看到每个检测到的对象的名称及其百分比概率,如下所示:
输出
car : 54.72719073295593
car : 58.94589424133301
car : 62.59384751319885
car : 74.07448291778564
car : 91.10507369041443
car : 97.26507663726807
car : 97.55765795707703
person : 53.6459743976593
person : 56.59831762313843
person : 72.28181958198547
原始图片:
原始图像“ test45”如下所示:
带有对象检测的图像:
检测到对象后,生成的图像如下所示:
可以看到ImageAI在图像中成功识别了汽车和人员。
结论
对象检测是最常见的计算机视觉任务之一。本文通过示例说明如何使用ImageAI库在Python中执行对象检测。
如果您有任何疑问,请在下面发表评论。
文章浏览阅读1.4k次。public class CodeExample { public static void main (String args[]) throws APIException { String access_token = ""; APINodeList<AdsInsights> execute = new AdAccount("account_id", context).getInsights().setDatePreset("日期").execute(.
文章浏览阅读3k次。想要绘制出如下类型坐标轴断开的图,matplotlib中并没有直接可用的API,但是官方给出了一个demo: broken axis.py大概说下思路:画出两个共享X轴,完全相同的图,下图取消上边界,下图取消下边界,然后再使用plot画两组平行线就大功告成。参照官网例子画的堆积图代码 def respond_mode_bar(self): labels = ['Braking','Right','Left','R&B','L&B'] # colo_plt 坐标轴 断裂
文章浏览阅读656次。在上一篇文章中,介绍了我软件中代码的布局,基于以上布局,我在和另外两名程序员合作中为了方便大家工作制订了,一系列标准,这种结构与这些标准的制订,在后来实现快速开发提供了有力的前提保证. 我的标准主要归纳为以下几点. 1,在上文中提到,用户对象,类,表是一一对应的,我在标准钟要求表的命名类的名称用户对象的名称一一对应,比如用户 client 对象 表的名子_标准化的开发与设计
文章浏览阅读1.1k次。PhpWord按word模板填充数据后下载下载 phpword模板填充下载(会在服务器生成一个word)修改后下载 phpwordcomposer require phpoffice/phpword模板填充下载(会在服务器生成一个word)$phpword=new PhpWord();$template=$phpword->loadTemplate('***.doc');//读取word模板$template->setValue('name','test');//填充数据$fil_php word 传参
文章浏览阅读3.7k次。第零章 Network此版本OAI epc 已支持多MME、多eNB、X2切换等功能,配置方式变化较大。环境:物理机(运行eNB):Ubuntu 18.04 LTS,core i7 8xxxU 3.4GHz x4,16G,128G SSD,USRP B210虚拟机(运行vEPC):Ubuntu16.04 LTS,内核4.9.x(受SPGW的限制),分配硬盘40G0.1 虚拟机中netw..._describe keyspace vhss
文章浏览阅读141次。?java-net-php-python-jspm图书管理系统计算机毕业设计程序。springboot基于springboot的仓库管理系统。springboot高校毕业生就业管理系统。springboot云音乐后端内容管理系统。基于Java技术的社区物业管理的设计与实现。springboot疫情下图书馆管理系统。springboot家政客户服务管理系统。springboot交通事故档案管理系统。_临沂大学图书寄存管理
文章浏览阅读1w次,点赞3次,收藏24次。vue2.x和vue3.x的区别_vue 3 vue 2
文章浏览阅读962次,点赞30次,收藏19次。本篇blog来分析和总结下树莓派系统文件以及他们的作用。使用的系统是Raspberry Pi OS with desktop。
文章浏览阅读204次。转自雷神博客:https://blog.csdn.net/leixiaohua1020/article/details/12720427类似题目的文章已经不新鲜了,这里,我仅仅总结自己的一些代码经验,结合两款在视频开发领域比较常用的开源软件探讨C语言的应用问题。1.为什么要用C语言曾几何时,我也不熟悉C,最早接触C的是在大学四年级,当时已经学过pascal,过二级也是pascal。接着..._c 语言avoutputformat *format
文章浏览阅读9.3k次,点赞12次,收藏106次。爬虫(spider,又网络爬虫),是指向网站/网络发起请求,获取资源后分析并提取有用数据的程序。从技术层面来说就是 通过程序模拟浏览器请求站点的行为,把站点返回的HTML代码/JSON数据/二进制数据(图片、视频) 爬到本地,进而提取自己需要的数据,存放起来使用。_爬虫
文章浏览阅读143次。尊敬的阿里云用户:阿里云简单日志服务SLS于2015年1月29日对外发布新版本,同时北京Region上线公测。详细信息如下:一、行为变更1.数据模型变更数据模型变更:Category变更为Logstore。原API格式依然兼容,推荐用户使用新的API。SLS接口文档2.离线归档行为变更离线归档行为变更:由归档到OD..._sls 简单日志服务 全称
文章浏览阅读472次。可以参照ErrorMvcAutoConfiguration;错误处理的自动配置;给容器中添加了以下组件 1、DefaultErrorAttributes:帮我们在页面共享信息;@Override public Map<String, Object> getErrorAttributes(RequestAttributes requestAttribute..._errorhtml spingboot