python-过滤文档
Python可以使用多种方式过滤文档,以下是其中一些常见的方法:
- 使用正则表达式过滤文本:
import re
text = "This is a sample text. It contains some numbers like 123 and 456."
匹配所有数字
numbers = re.findall(r'\d+', text) print(numbers)
匹配所有单词
words = re.findall(r'\b\w+\b', text) print(words)
- 使用列表推导式过滤列表:
numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
过滤出所有偶数
even_numbers = [n for n in numbers if n % 2 == 0] print(even_numbers)
过滤出所有大于5的数字
numbers_gt_5 = [n for n in numbers if n > 5] print(numbers_gt_5)
- 使用filter()函数过滤列表:
def is_even(n): return n % 2 == 0
numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
过滤出所有偶数
even_numbers = list(filter(is_even, numbers)) print(even_numbers)
- 使用pandas库过滤数据框:
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'], 'age': [25, 30, 35, 40]}
df = pd.DataFrame(data)
过滤出所有年龄大于30的人
df_filtered = df[df['age'] > 30] print(df_filtered)
原文地址: https://www.cveoy.top/t/topic/m4u 著作权归作者所有。请勿转载和采集!