如何从 Pandas 数据框中删除包含特定关键词的第一列行
"如何从 Pandas 数据框中删除包含特定关键词的第一列行" \n\n要删除第一列带有某些关键词的行,你可以使用以下步骤:\n\n1. 首先,检查第一列是否包含关键词。使用pandas的str.contains()方法来检查每个单元格是否包含关键词。这将返回一个布尔值的Series。\n2. 然后,使用布尔索引来选择那些第一列不包含关键词的行。使用~操作符来取反布尔值,获取不包含关键词的行。\n3. 最后,使用drop()方法删除这些行。将布尔索引传递给drop()方法,选择要删除的行。\n\n下面是一个示例代码:\n\npython\nimport pandas as pd\n\n# 创建一个示例数据框\ndata = {'Col1': ['apple', 'banana', 'orange', 'grape'],\n 'Col2': [1, 2, 3, 4],\n 'Col3': [5, 6, 7, 8]}\ndf = pd.DataFrame(data)\n\n# 定义要删除的关键词\nkeywords = ['apple', 'grape']\n\n# 检查第一列是否包含关键词\nmask = df['Col1'].str.contains('|'.join(keywords))\n\n# 选择不包含关键词的行\nfiltered_df = df[~mask]\n\n# 删除这些行\nfiltered_df = filtered_df.drop(filtered_df.columns[0], axis=1)\n\nprint(filtered_df)\n\n\n输出结果:\n\n\n Col2 Col3\n1 2 6\n2 3 7\n\n\n在这个示例中,我们创建了一个包含三列的数据框。然后,我们定义了要删除的关键词列表。我们使用str.contains()方法检查第一列是否包含这些关键词,并将结果存储在mask变量中。接下来,我们使用布尔索引选择不包含关键词的行,并将结果存储在filtered_df变量中。最后,我们使用drop()方法删除第一列,并打印出过滤后的数据框。
原文地址: https://www.cveoy.top/t/topic/p4P3 著作权归作者所有。请勿转载和采集!