「Python数据分析」Pandas基础,筛选数据利器:布尔索引

liftword3个月前 (04-08)技术文章18

我们在处理数据的时候,数据筛选是一个重要的过程。利用布尔索引,我们可以选择需要的数据区间。布尔索引,是利用各种不等式,以及与或非操作,来对数据区间进行选择。

在pandas中,与操作,对应的是 & 这个符号,表示选取两个数据集重合的部分。

或操作,对应的是 | 这个符号,表示选择两个数据集中,只要在一个数据集中出现的部分。

非操作,对应的是 ~ 这个符号,表示选取一个数据集中,相反的部分。

我们下面通过具体的例子,来进行说明。

series数据

生成原始数据集

选择s中,大于0的部分

选择s中,小于-1,或者大于0.5的部分

这里要注意,或操作前后,需要通过小括号,把判断的部分括起来。操作是针对series的值进行的,不是针对索引进行的。

选择s中,小于0的非的数据

非操作,就是相反的部分,也就是选择大于等于0的部分数据

dataframe数据

先生成所需的原始数据

选择A列中,数值大于0的数据

选择B列中,数值小于0,或者数据大于1的数据

其它的操作,大家可以根据上面代码,编写程序实践练习。

总结

通过布尔索引选择数据,可以通过条件,或者是区间,来选择我们所需的数据集。在实际的数据分析过程当中,有很多情况,是需要通过布尔索引,来判断选择所需要分析的子数据集。

掌握好布尔索引操作,是对数据切片选择的一个很好的补充。布尔索引的与或非操作,比较抽象,建议大家通过对照实际筛选出来的数据集,进行联系。

相关文章

三天带你轻松学会python数据分析基础,拿走不谢

Python应用广泛,尤其在数据处理方面功能强大,这本书讲述了数据的抓取、处理、可视化。【文末领取】获取方式:...

「Python数据分析」Pandas基础,通过索引选择数据

原始数据处理过程1、通过函数,生成上图所示的原始数据集2、选择某一单元格中的值3、交换数据集中A、B列的值4、选择A列和B列,形成新的数据集处理过程1新建文件夹和Python笔记本源程序,导入pand...

小白零基础学习路线,完整的自学python数据分析的学习路线

数据分析师已经存在多年了,但是,对该职业的需求从2018年开始,对数据分析师的需求猛增,目前数据分析师的前景已然非常好!预计到2025年,「数据分析师」将成为需求最大的工作之一。由于这种现象,我们看到...

学习Pandas:Python数据分析的利器

一、什么是Pandas?Pandas是Python中用于数据分析和处理的核心库,提供了高效的数据结构和数据分析工具。它由Wes McKinney于2008年开发,名字来源于“Panel Data”(面...

进阶数据分析该怎么学习Python和SQL

1、先明白需求数据分析及运营管理是一种数据驱动的能力,而并非仅仅学学Python或者SQL这么简单。当然,我能理解你的意思,想学习数据分析工具。Python和SQL各有所长,搭配使用是最好的。2、如何...

python(pandas + numpy)数据分析的基础

数据 NaN 值排查,统计,排序data.isnull()data 是一个 dataframe 的结构np.sum(data.isnull())找到缺失值的总数data.sort_values()按照...