Pandas提供了多种方法进行字段模糊查询,以下是其中几种常用方法:

  1. 使用str.contains()方法

该方法可以对Series或DataFrame中的字符串进行模糊查询,返回一个bool类型的Series,表示每个元素是否包含指定字符串。

例如,对DataFrame中的某一列进行模糊查询:

import pandas as pd

data = {'name': ['Tom', 'Jerry', 'Mike', 'John'],
        'age': [20, 25, 30, 35],
        'gender': ['male', 'male', 'female', 'male']}
df = pd.DataFrame(data)

result = df[df['name'].str.contains('o')]
print(result)

输出结果为:

  name  age gender
0  Tom   20   male
3 John   35   male
  1. 使用str.startswith()或str.endswith()方法

这两个方法分别表示以指定字符串开头或结尾的元素,返回一个bool类型的Series。

例如,对DataFrame中的某一列进行模糊查询:

result = df[df['name'].str.startswith('J')]
print(result)

输出结果为:

   name  age gender
3  John   35   male
  1. 使用str.match()方法

该方法使用正则表达式进行匹配,返回一个bool类型的Series。

例如,对DataFrame中的某一列进行模糊查询:

result = df[df['name'].str.match('^J')]
print(result)

输出结果为:

   name  age gender
3  John   35   male

以上是几种常用的字段模糊查询方法,可以根据实际情况选择适合的方法


原文地址: https://www.cveoy.top/t/topic/ffkl 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录