程序员文章、书籍推荐和程序员创业信息与资源分享平台

网站首页 > 技术文章 正文

「Python数据分析」Pandas基础,筛选数据利器:布尔索引

hfteth 2025-03-12 15:07:16 技术文章 21 ℃

我们在处理数据的时候,数据筛选是一个重要的过程。利用布尔索引,我们可以选择需要的数据区间。布尔索引,是利用各种不等式,以及与或非操作,来对数据区间进行选择。

在pandas中,与操作,对应的是 & 这个符号,表示选取两个数据集重合的部分。

或操作,对应的是 | 这个符号,表示选择两个数据集中,只要在一个数据集中出现的部分。

非操作,对应的是 ~ 这个符号,表示选取一个数据集中,相反的部分。

我们下面通过具体的例子,来进行说明。

series数据

生成原始数据集

选择s中,大于0的部分

选择s中,小于-1,或者大于0.5的部分

这里要注意,或操作前后,需要通过小括号,把判断的部分括起来。操作是针对series的值进行的,不是针对索引进行的。

选择s中,小于0的非的数据

非操作,就是相反的部分,也就是选择大于等于0的部分数据

dataframe数据

先生成所需的原始数据

选择A列中,数值大于0的数据

选择B列中,数值小于0,或者数据大于1的数据

其它的操作,大家可以根据上面代码,编写程序实践练习。

总结

通过布尔索引选择数据,可以通过条件,或者是区间,来选择我们所需的数据集。在实际的数据分析过程当中,有很多情况,是需要通过布尔索引,来判断选择所需要分析的子数据集。

掌握好布尔索引操作,是对数据切片选择的一个很好的补充。布尔索引的与或非操作,比较抽象,建议大家通过对照实际筛选出来的数据集,进行联系。

Tags:

最近发表
标签列表