Pandas 数据处理:提取系统版本列第一个数字并转为数值型
您可以使用 pandas 中的 str.extract 函数和正则表达式来提取第一个数字,并将其转换为数值型。以下是一个示例代码:
import pandas as pd
# 创建一个包含 system_version 列的 DataFrame
df = pd.DataFrame({'system_version': ['6', '6.2.3', '9.1']})
# 使用正则表达式提取第一个数字
df['system_version'] = df['system_version'].str.extract(r'(\d+)', expand=False)
# 将提取的结果转换为数值型
df['system_version'] = pd.to_numeric(df['system_version'])
# 打印转换后的结果
print(df)
输出结果为:
system_version
0 6
1 6
2 9
在这个例子中,我们使用正则表达式 (\d+) 来匹配字符串中的数字,并使用 str.extract 函数将匹配的结果提取出来。然后,使用 pd.to_numeric 函数将提取的结果转换为数值型。最后,我们将转换后的结果赋值给原来的 system_version 列。
原文地址: https://www.cveoy.top/t/topic/qvcw 著作权归作者所有。请勿转载和采集!