pandas、numpy篇——计数、排序、分类_pandas where 计数-程序员宅基地

numpy:

np.unique(nd)

counts = defaultdict(int)
for key in dict:
    counts[key] += 1

np.sort(list,axis=0,kind='quicksort')
np.searchsorted(sorted list,values,side='left')
np.argmax()
np.argmin()
np.argsort(nd,axis)返回排序后所在的索引nd,shape同nd
ind = np.lexsort((b,a)) # Sort by a, then by b
np.where(condition,x,y)

pandas:

pd.unique(series)

category=df[key].astype('category')将series作为分类标准,返回分类实例
category.values.category,返回种类,无重复值,完成unique操作
category.values.codes,返回每个样本对应的种类序号,用0 1 2 表示
category.cat.category,同values
category.cat.codes,同values
category.cat.set_category(categories list),设置种类
category.cat.remove_unused_categories(),删除未用到的种类
pd.get_dummies(category),将category onehot编码,返回多维度特征

df.value_counts()
pd.value_counts(df)

df.sort_values(by=['column1','col2'],axis=0,ascending=True,na_position='first')
series.searchsorted(value,side='left')插入value时的index,如果value在series中,left为左index
series.nsmallest(3) series.nlargest(3)

df.qcut(series,[0,0.25,0.5,0.75,1.])4分位分类,返回类别list[(],(],(]...]
df.qcut(series,4,labels=['a','b','c','d']),进行4分位分类,返回所属类别list['b','a','c','d'...]

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/sbjqiaoqiao/article/details/80698044

智能推荐

目前市场上的电脑一体机从计算机种类,一体机电脑与普通电脑的区别-程序员宅基地

文章浏览阅读639次。现在,市场上开始流行一体机电脑了,很多网友可能会对一体机电脑感兴趣。下面,本文针对市场上的一体机电脑优劣作一个简要说明。一、一体机电脑的好处由于一体机电脑,所有的设备都封装在同一个容器内,就连显示屏都和电脑的设备融为一体了。因此,一体电脑的放置、携带,是相当的方便。它的好处就是方便放置,放哪里都行,因为不占空间。二、一体机电脑的弊端由于一体机电脑把传统的机箱内的所有设备和显示屏,都合为一体了,可见..._企业版一体机与普通一体机的区别

Ubuntu 11.04 CUDA4.0的安装与编译_ubuntu cuda11.4安装编译样例时一直不停止-程序员宅基地

文章浏览阅读729次。出差的时候网上查了查相关的资料,回来用了早上的空余时间编译通了,主要的参考网址有两个:中文:http://topic.csdn.net/u/20110809/13/281a50dc-605f-4b32-92bf-4193eeebf7ec.html英文:http://forums.nvidia.com/index.php?showtopic=198030 Now, let's go._ubuntu cuda11.4安装编译样例时一直不停止

基于最小二乘、迭代和相位梯度校正的解包裹算法实例分析_精确最小二乘法解相位包裹-程序员宅基地

文章浏览阅读1.8k次,点赞3次,收藏7次。基于最小二乘、迭代和相位梯度校正的解包裹算法(CPILSI)实例_精确最小二乘法解相位包裹

python中easy_install 卸载已经安装的包_mac 卸载easy_install-程序员宅基地

文章浏览阅读2k次。用easy_install安装Python的包很方便,在mac下有时还必须要用macports来安装python的包,这个时候就会产生冲突。我保留macports的python版本,要看用的是哪个python版本,可以用which命令which python/opt/local/bin/python说明用的是macports安装的python,如果显示的是/usr 下面的,说明_mac 卸载easy_install

Unity urp2d ShaderGraph 实现一个黑白转彩色的场景渐变效果 设计思路_unity渐变shader-程序员宅基地

文章浏览阅读3.4k次,点赞11次,收藏22次。那只能走走别的方向了,仔细想想,原来的shader也确实不太完美,因为我们要的是整个画面的黑白,而上面的shader则需要给每个场景物品都安装这个shader跑计算的话,无疑是降低了性能和扩展性的。我们可以放弃if节点,改用lerp在两个色域中做插值,就可以优化渐变效果,插值需要一个0-1的参数,我们选择使用“Saturate”节点,这个节点可以将一个浮点值映射到[0,1]的范围内,即输入大于1时=1,输入小于0时等于0,然后将结果连接到Lerp节点就可以了。这样我们这个效果就成功实现了。_unity渐变shader

Zookeeper、Dubbo面试题总结_下列有关zookeeper的说法不正确的是? 一个分布式的,开放源码的分布式应用程序协调-程序员宅基地

文章浏览阅读205次。【zookeeper面试】ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,它是集群的管理者,监视着集群中各个节点的状态根据节点提交的反馈进行下一步合理操作。最终,将简单易用的接口和性能高效、功能稳定的系统提供给用户。1、zookeeper是一个开源的分布式协调服务框架。2、应用场景:分布式通知/协调、负载均衡、配置中心..._下列有关zookeeper的说法不正确的是? 一个分布式的,开放源码的分布式应用程序协调

随便推点

qt -- raise()、hide()、isHidden()、setVisible()、isVisible()、close()的解释_qt raise-程序员宅基地

文章浏览阅读1.2w次,点赞9次,收藏73次。1、raise()[slot] void QWidget::raise()将此窗体提升到父窗体堆栈的顶部。在此调用之后,窗体将位于任何重叠的同级窗体的前面。2、hide()3、isHidden()4、setVisible()5、isVisible()6、close()_qt raise

元胞自动机算法汇总含matlab代码_数学建模(十三)_元胞自动机matlab-程序员宅基地

文章浏览阅读4.2w次,点赞94次,收藏679次。元胞自动机理论许多复杂的问题都可以通过元胞自动机来建立模型,元胞自动机实质上是定义在一个具有离散、有限状态的元胞组成的元胞空间上,并按照一定的局部规则,在离散的时间维度上演化的动力学系统。元胞又可称为单元、细胞,是元胞自动机的最基本的组成部分。元胞具有以下特点:1)元胞自动机最基本的单元。2)元胞有记忆贮存状态的功能。3)所有元胞状态都按照元胞规则不断更新。演化规则中心元胞的下一个..._元胞自动机matlab

springboot+springcloud + elasticsearch (电商平台搜索功能)_按照价格区间查询条件 前端传参-程序员宅基地

文章浏览阅读1.8k次。搜索关键字查询0.1 构建查询条件1). 需求2). 接口定义public interface SearchService {//按照查询条件进行数据查询Map search(Map<String,String> searchMap);}方法形参 Map : 关键字 , 品牌 , 规格 , 价格 , 排序, 分页参数 ;返回值为 Map : 分页结果 , 结果列表 ..._按照价格区间查询条件 前端传参

【物联网】思科扔下数颗物联网重磅炸弹,中国IoT圈却选择集体视而不见!_cisco kinetic和jasper-程序员宅基地

文章浏览阅读1.4k次。来源: 物联网智库 原创 作者:物女王 就在前几天,一年一度的Cisco Live 2017用户大会上,思科发布了其10年来最具颠覆性的创新,说是开启了IoT的新时代都不为过,但国内物联网圈却选择集体视而不见,眼睁睁地与里程碑式的革新擦肩而过。随着数据量、连接性、计算能力的迅速提高,人工智能、增强现实和机器人技术的持续迭代,想要充分实现投资回报,有效利用物联网产生的数据,企业越来越需要一种能够统一_cisco kinetic和jasper

c语言与编程语言的区别,C语言与其他编程语言的区别-程序员宅基地

文章浏览阅读5k次。答案:C语言 主要因为它具有强大的功能。许多著名的系统软件, 如PC-DOS,DBASE Ⅳ都是由C语言编写的。用C语言加上一些汇编语言子程序, 就更能显示C语言的优势了。归纳起来C语言具有下列特点:1. C是中级语言它把高级语言的基本结构和语句与低级语言的实用性结合起来。C语言可以象汇编语言一样对位、字节和地址进行操作,而这三者是计算机最基本的工作单元。2. C是结构式语言结构式语言的显著特点是...

jocky混淆JAVA代码(保护你的JAVA项目)_ide 混淆编写的java-程序员宅基地

文章浏览阅读592次。一、前言1.1 什么是Jocky? 我们知道,Java是一种跨平台的编程语言,其源码(.java文件)被编译成与平台无关的字节码(.class文件),然后在运行期动态链接。这样,编译后的类文件中将包含有符号表,从而使得Java程序很容易被反编译。相信每一个Java开发人员,都曾经用过诸如Jad之类的反编译器,对Java的class 文件进行反编译,从而观察程序的结构与实现细节。如此一来_ide 混淆编写的java

推荐文章

热门文章

相关标签