Python是目前最流行最简单用途最广泛的编程语言,大数据时代最应拉悟有仍该学习的一门编程语言。其中,数据分析的库p锾攒揉敫andas是Python最经典的库之一。现在我们看一下DataFrame的唯一值和值计数及成员资格的例子。
工具/原料
python
anaconda,spyder
DataFrame,Series
方法/步骤
1、前提:加载numpy、pandas、和Series,DataFrame。生成一个Series,命名为s,如图
2、Series的唯一值和值计数。使用s.unique()、s.value_counts()分别计算s的唯一值和各值的计数,如图
3、使用pandas的顶级方法也可以实现值计数的功能。pd.value_counts(s.value衡痕贤伎s)即可实现值计数,再尝试一下一下sort的排序功能,如图
4、使用isin判断s的成员资格。s.isin(['a','c'])釉涑杵抑表示s的元素是否在集合{'a',&垆杪屑丝#39;c'}中,若在的话,即为True,否则False,同时使用过滤取出在集合中的数据,如图
5、关于值计数的柱形图。使用df.apply(pd.value_counts).fillna(0)可以计算出每个元素出现的次数,分别查看处理前后的柱形图,如下