使用 Pandas 填充指定列的空值:完整指南

Pandas 是 Python 中用于数据分析的强大库,它提供了许多处理数据缺失值的方法。其中 fillna() 方法可以方便地给指定数据列里的空值赋值。

具体步骤如下:

  1. 导入 Pandas 库
import pandas as pd
  1. 创建 DataFrame
data = {'A': [1, 2, 3, None, 5],
        'B': [6, None, 8, 9, 10],
        'C': [11, 12, 13, 14, 15]}
df = pd.DataFrame(data)
  1. 使用 fillna() 方法给指定数据列(比如 B 列)里的空值赋值
df['B'] = df['B'].fillna(0)  # 将 B 列里的空值赋值为 0
  1. 输出结果
print(df)

输出结果如下:

     A     B   C
0  1.0   6.0  11
1  2.0   0.0  12
2  3.0   8.0  13
3  NaN   9.0  14
4  5.0  10.0  15

可以看到,B 列里的空值已经被赋值为 0。

使用 fillna() 方法的更多选项:

  • method='ffill': 使用前一个值填充空值
  • method='bfill': 使用后一个值填充空值
  • limit=n: 指定使用前一个值或后一个值填充的次数
  • value=x: 使用指定的值 x 填充空值

示例:

# 使用前一个值填充空值
df['A'] = df['A'].fillna(method='ffill')

# 使用后一个值填充空值
df['C'] = df['C'].fillna(method='bfill', limit=1)

通过掌握 fillna() 方法,您可以轻松地处理数据缺失问题,提高数据分析的效率和准确性。

Pandas 填充指定列的空值:完整指南

原文地址: https://www.cveoy.top/t/topic/lE6R 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录