Python可以使用多种方式过滤文档,以下是其中一些常见的方法:

  1. 使用正则表达式过滤文本:

import re

text = "This is a sample text. It contains some numbers like 123 and 456."

匹配所有数字

numbers = re.findall(r'\d+', text) print(numbers)

匹配所有单词

words = re.findall(r'\b\w+\b', text) print(words)

  1. 使用列表推导式过滤列表:

numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

过滤出所有偶数

even_numbers = [n for n in numbers if n % 2 == 0] print(even_numbers)

过滤出所有大于5的数字

numbers_gt_5 = [n for n in numbers if n > 5] print(numbers_gt_5)

  1. 使用filter()函数过滤列表:

def is_even(n): return n % 2 == 0

numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

过滤出所有偶数

even_numbers = list(filter(is_even, numbers)) print(even_numbers)

  1. 使用pandas库过滤数据框:

import pandas as pd

data = {'name': ['Alice', 'Bob', 'Charlie', 'David'], 'age': [25, 30, 35, 40]}

df = pd.DataFrame(data)

过滤出所有年龄大于30的人

df_filtered = df[df['age'] > 30] print(df_filtered)

python-过滤文档

原文地址: https://www.cveoy.top/t/topic/m4u 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录