Pandas 数据筛选:根据多个条件提取子集
这行代码使用 Pandas 库从数据框 filtered_df 中筛选出符合特定条件的子集。代码如下:
rslt_df = filtered_df[filtered_df['property'].str.contains('A|B|C|D|E|F|G|H') & filtered_df['name'].isin(['air'])]
代码的功能是:
- 筛选条件:
- 'property' 列包含字母 'A'、'B'、'C'、'D'、'E'、'F'、'G' 或 'H'。
- 'name' 列包含字符串 'air'。
- 操作方法:
str.contains()函数用于判断字符串是否包含指定的子串。isin()函数用于判断元素是否在指定的列表中。&符号代表逻辑与(AND)关系,用于组合多个筛选条件。
- 结果存储:
- 将筛选后的子集存储在一个新的数据框
rslt_df中。
- 将筛选后的子集存储在一个新的数据框
代码解析:
filtered_df['property'].str.contains('A|B|C|D|E|F|G|H'):筛选出 'property' 列中包含字母 'A'、'B'、'C'、'D'、'E'、'F'、'G' 或 'H' 的行。filtered_df['name'].isin(['air']):筛选出 'name' 列中包含字符串 'air' 的行。&符号将两个筛选条件组合在一起,即只有同时满足两个条件的行才会被选中。- 最后,将满足所有条件的行存储在新的数据框
rslt_df中。
总结:
这行代码使用 Pandas 库的筛选功能,根据 'property' 列包含特定字母和 'name' 列包含特定字符串的条件,从数据框 filtered_df 中提取符合条件的子集。
原文地址: https://www.cveoy.top/t/topic/ndpY 著作权归作者所有。请勿转载和采集!