Python Pandas 数据筛选:保留特定值的技巧

在数据分析中,我们经常需要从数据集中筛选出符合特定条件的数据。本文将介绍如何使用 Python 的 Pandas 库,仅保留 '单品名称' 列中包含特定值的行的技巧。

代码示例

以下 Python 代码演示了如何使用 Pandas 库实现数据筛选:pythonimport pandas as pd

读取数据文件data = pd.read_csv('data.csv')

指定需要保留的值values_to_keep = ['白玉菇(袋)', '菠菜', '菠菜(份)', '菜心', '虫草花(份)', '高瓜(1)', '高瓜(2)', '海鲜菇(包)', '红椒(2)', '红莲藕带', '红薯尖', '洪湖藕带', '姜蒜小米椒组合装(小份)', '金针菇(盒)', '净藕(1)', '菱角', '螺丝椒', '螺丝椒(份)', '木耳菜', '木耳菜(份)', '奶白菜', '七彩椒(2)', '青红杭椒组合装(份)', '青茄子(1)', '青线椒(份)', '上海青', '双孢菇(盒)', '娃娃菜', '外地茼蒿', '芜湖青椒(1)', '西兰花', '西峡花菇(1)', '鲜木耳(份)', '苋菜', '小米椒(份)', '小青菜(1)', '小皱皮(份)', '蟹味菇与白玉菇双拼(盒)', '野生粉藕', '圆茄子(2)', '云南生菜', '云南生菜(份)', '云南油麦菜', '云南油麦菜(份)', '长线茄', '枝江青梗散花', '竹叶菜', '紫茄子(1)', '紫茄子(2)']

筛选保留指定值的行filtered_data = data[data['单品名称'].isin(values_to_keep)]

输出筛选结果print(filtered_data)

代码说明

  1. 导入 Pandas 库: import pandas as pd 首先,我们需要导入 Pandas 库,以便使用其强大的数据处理功能。

  2. 读取数据: data = pd.read_csv('data.csv') 使用 read_csv() 函数读取数据文件。请将 'data.csv' 替换为你的实际文件名。

  3. 指定保留值: values_to_keep = [...] 创建一个列表,包含所有需要保留的 '单品名称' 值。

  4. 筛选数据: filtered_data = data[data['单品名称'].isin(values_to_keep)] 使用 isin() 函数筛选 '单品名称' 列中包含指定值的 rows,并将结果存储在 filtered_data 变量中。

  5. 输出结果: print(filtered_data) 打印筛选后的 DataFrame,显示仅包含指定 '单品名称' 值的 rows。

总结

通过以上步骤,你可以使用 Python Pandas 库轻松地筛选数据,仅保留特定列中包含指定值的 rows。这种数据处理技巧在数据分析和清理过程中非常实用。

Python Pandas 数据筛选:保留特定值的技巧

原文地址: https://www.cveoy.top/t/topic/epkK 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录