Pandas 填充指定列的空值:完整指南
使用 Pandas 填充指定列的空值:完整指南
Pandas 是 Python 中用于数据分析的强大库,它提供了许多处理数据缺失值的方法。其中 fillna() 方法可以方便地给指定数据列里的空值赋值。
具体步骤如下:
- 导入 Pandas 库
import pandas as pd
- 创建 DataFrame
data = {'A': [1, 2, 3, None, 5],
'B': [6, None, 8, 9, 10],
'C': [11, 12, 13, 14, 15]}
df = pd.DataFrame(data)
- 使用 fillna() 方法给指定数据列(比如 B 列)里的空值赋值
df['B'] = df['B'].fillna(0) # 将 B 列里的空值赋值为 0
- 输出结果
print(df)
输出结果如下:
A B C
0 1.0 6.0 11
1 2.0 0.0 12
2 3.0 8.0 13
3 NaN 9.0 14
4 5.0 10.0 15
可以看到,B 列里的空值已经被赋值为 0。
使用 fillna() 方法的更多选项:
method='ffill': 使用前一个值填充空值method='bfill': 使用后一个值填充空值limit=n: 指定使用前一个值或后一个值填充的次数value=x: 使用指定的值x填充空值
示例:
# 使用前一个值填充空值
df['A'] = df['A'].fillna(method='ffill')
# 使用后一个值填充空值
df['C'] = df['C'].fillna(method='bfill', limit=1)
通过掌握 fillna() 方法,您可以轻松地处理数据缺失问题,提高数据分析的效率和准确性。
原文地址: https://www.cveoy.top/t/topic/lE6R 著作权归作者所有。请勿转载和采集!