Python是目前最流行最简单用途最广泛的编程语言,大数据时代最应拉悟有仍该学习的一门编程语言。其中,数据分析的库p锾攒揉敫andas是Python最经典的库之一。现在我们看一下DataFrame的缺失值如何判断和处理。
工具/原料
python
anaconda,spyder
DataFrame,Series
方法/步骤
1、前提:加载numpy、pandas、和Series,DataFrame。生成一个含有缺失值的Series,命名为s1,如图
2、缺失值的判断方法。s1.isnull()和s1.notnull()分别是判断元素是缺失值或者不是缺失值,刚好是相反的功能,如图
3、Series缺失值的删除。s1.dropna()为删除s1的缺失值后的数倌栗受绽据,s1[s1.notnull()]则为取出s1中不是缺失值的数据,从2个方面得到的结果一样,也就是所谓的条条道路通罗马,如图
4、为了看看DataFrame是如何删除缺失值的,新生成一个df2,如图
5、df2.d筠续师诈ropna()默认删除了含有缺失值的所有行,如果我们只需要把某一行所有数据为缺失值的才删除,那么需要用how=‘all’进行覆诈端螽限制,如df2.dropna(how='all'),操作如图
6、如果要删除DataFrame的缺失值所在的列,那么只需加上axis=1即可,如图