sklearn机器学习包常用函数(连载)_喜欢请人吃饭的程序媛的博客-程序员宝宝

技术标签: 数据分析  机器学习  sklearn  人工智能  

做机器学习案例时,每个案例都会用到sklearn中不同的函数,导包时真的很头大!!!到底用哪个?为什么有的是model_selection?有的是feature_selection?有的是feature_extraction?有的是processing?本文就是为了解决自己的这个问题而写。(挖了好大一个坑欸)

第一部分:收集整理函数名(完成)
第二部分:每个函数的作用(择日填坑)
第三部分:每个函数的应用场景(择日填坑)
参考:https://scikit-learn.org/stable/user_guide.html#user-guide

sklearn包括以下内容:

一、监督学习
广义线性模型
支持向量 
最近邻 
高斯过程 
交叉分解 
朴素贝叶斯 
决策树 
集成方法  
多类与多标签 
神经网络(有监督) 

在这里插入图片描述

二、非监督学习
高斯混合模型
流形学习
聚类
矩阵分解
协方差估计
异常检测
密度估计
神经网络模型(无监督)

在这里插入图片描述

三、模型选择与评估
交叉验证
调整估计器的超参数
模型评估

在这里插入图片描述

四、检验
依赖图

在这里插入图片描述

五、数据集转换
评估器合并
特征提取
预处理数据
缺失值插补
无监督降维
预测目标y的转换

在这里插入图片描述

六、数据集加载工具
小型标准数据集
较大数据集
随机样本生成器
下载数据集

在这里插入图片描述文章里大图放不下,拆成小图,若有需要全图的小伙伴,
评论里留联系方式哦

在这里插入图片描述

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/ZhanZhan1231/article/details/103720786

智能推荐

一位数据挖掘成功人士给数据挖掘在读研究生的建议(转)_onebai的博客-程序员宝宝

原文网址:http://www.cognoschina.net/club/viewthread.php?tid=1518关于数据挖掘方面的研究,我原来也走过一些弯路。其实从数据挖掘的起源可以发现,它并不是一门崭新的科学,而是综合了统计分析、机器学习、人工智能、数据库等诸多方面的研究成果而成,同时与专家系统、知识管理等研究方向不同的是,数据挖掘更侧重于应用的层面。因此来说,数据挖掘融合了相当多的内容...

Hive之——表属性操作_hive line.delim_冰 河的博客-程序员宝宝

1、修改表名alter table table_name rename to new_table_name;2、修改列表alter table table_name change column c1 c2 int comment 'xxxx';alter severity; //可以把改列放到指定列的后面,或者使用'first'放到第一位3、增加列alter table table_name a...

python中的匿名函数_python之匿名函数_weixin_39645019的博客-程序员宝宝

前言在python中,我们不仅仅可以定义普通的函数,所谓的普通函数就是使用def关键字定义的函数。同时还可以定义匿名函数语法lambda 参数列表 : 表达式说明使用lambda关键字创建匿名函数。所谓匿名函数,就是没有名字的函数。匿名函数冒号后面的表达式有且只能有一个,注意:是表达式,而不是语句。匿名函数自带return,而return的结果就是表达式的计算后的结果。匿名函数调用步骤一:将创...

(python pip安装第三方库超时问题(raise ReadTimeoutErrorself._pool, None, ‘Read timed out.‘)_书启秋枫的博客-程序员宝宝

ReadTimeoutError(self._pool, None, “Read timed out.”)pip._vendor.urllib3.exceptions.ReadTimeoutError:HTTPSConnectionPool(host=‘files.pythonhosted.org’, port=443): Read timed out.根本原因:下载的库是国外的,连接的慢 。所以 ,给他多配置点时间报错页面C:\Users\LDH>pip install fak

el jsp 表达式 默认值_EL表达式以及JSTL标签库简单介绍_王滕昊的博客-程序员宝宝

EL表达式学习我们都知道EL表达式为我们获取作用域数据提供了极大的方便,因此有必要掌握它.1. 使用传统方式在jsp中获取作用域数据(1) 使用传统方式在jsp中获取作用域的数据有什么不方便的地方?答:需要通过脚本段表达式来获取,一般还要导包和强制类型转换等2. 表达式的概念介绍和基本语法(1) 视频中在jsp中使用脚本段语句获取作用域中的数据的缺陷是?答: 需要通过脚本段表达式来获取,一般还要导...

shell-打印一段时间的脚本_大飞哥2的博客-程序员宝宝

准备脚本:#!/bin/bash startdate="2017-03-10"date1=$(date -d "2017-03-10" "+%s")date2=$(date -d "2017-03-15" "+%s")date_count=$(echo "$date2 - $date1"|bc)day_m=$(echo "$date_count"/86400|bc)for ((...

随便推点

thinkphp日志泄漏漏洞_ThinkPHP框架任意代码执行漏洞的利用及其修复方法_weixin_39955154的博客-程序员宝宝

ThinkPHP是国内著名的开源的PHP框架,是为了简化企业级应用开发和敏捷WEB应用开发而诞生的。最早诞生于2006年初,原名FCS,2007年元旦正式更名为ThinkPHP,并且遵循Apache2开源协议发布。早期的思想架构来源于Struts,后来经过不断改进和完善,同时也借鉴了国外很多优秀的框架和模式,使用面向对象的开发结 构和MVC模式,融合了Struts的Action和Dao思想和JSP...

OpenSSL v0.9.8a随机数发生器分析(合集)_软件随机数发生器 熵源_艾米的爸爸的博客-程序员宝宝

OpenSSL随机数发生器本文档对OpenSSL使用的随机数进行研究分析,主要涉及OpenSSL v0.9.8a的随机数发生器以及其在Windows系统下的熵源采集情况。目录1. 概况... 11.1 OpenSSL随机数发生器概况... 11.2 OpenSSL 0.9.8a的随机数发生器概述... 22. 随机数发生器内部状态... 33. 函数说明... 4...

day01 python基础_终止偏移量大于“长度-1”会被当成-1。_Daniel_Alan的博客-程序员宝宝

一:写在前面 编程语言:能够被计算机所识别的表达方式就是编程语言,语言是沟通的介质,而编程语言是程序员与计算机沟通的介质,在编程的世界里,计算机更像是人的奴隶,人类编程的目的就是命令奴隶去工作。 编程:编程即程序员根据需求把自己的思想流程按照某种编程语言的语法风格编写下来,产出的结果就是包含一堆字符的文件。 强调:程序在未运行前跟普通文件无异,只有程序在运行...

什么是 Canny 边缘检测算法?_小白学视觉的博客-程序员宝宝

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达一、简介Canny 边缘检测器是一种多步算法,用于检测任何输入图像的边缘。它涉及在检测图像边缘时要...

JAVA对string进行按行分割_string根据换行分割_路边闲人2的博客-程序员宝宝

java处理字符串的时候需要将文本按行分割,一般使用string.split("\n"),但这样会因为不同平台下文本换行的不同而造成分割的文本带有‘\r’而出现错误。正确的做法是:String lines[] = String.split("\\r?\\n");既能将\r\n结尾的windows格式文本处理好,也能交\n结尾的linux格式处理好,还可以将以\r结尾的Mac的文本处理好。参考:https://ask.csdn.net/question...

surefire 拉起testng单元测试类的源码流程阅读(二)_lxlmycsdnfree的博客-程序员宝宝

这里是基于surefire 2.19.1版本分析的。还是根据surefire 拉起单元测试执行报错的日志展示的执行过程分析java.lang.instrument.IllegalClassFormatException: Error while instrumenting class com/suning/imp/scheduler/ActivityDoneMonitorSchedul

推荐文章

热门文章

相关标签