Pandas 数据处理：如何处理缺失值 (NaN) 并填充

在数据分析过程中，经常会遇到数据集包含缺失值 (NaN) 的情况。Pandas 库提供了强大的工具来处理这些缺失值，本文将以一个简单的例子演示如何使用 Pandas 处理缺失值，并使用平均值和中位数等方法填充缺失值。

1. 查找并显示数据集中的空值和缺失值

data = {'学生姓名': ['张三', '李四', '王五', '赵六', '钱七'],
        '数学成绩': [85, None, 92, 78, 88],
        '语文成绩': [90, 86, None, 77, 91]}
df = pd.DataFrame(data)

# 查找并显示空值
res = df.isnull()
print(res)

2. 使用适当的方法填充缺失值

# 使用平均值填充数学成绩
df['数学成绩'].fillna(df['数学成绩'].mean(), inplace=True)

# 使用中位数填充语文成绩
df['语文成绩'].fillna(df['语文成绩'].median(), inplace=True)

print(df)

3. 显示填充后的数据集内容

# 使用字典方法批量填充缺失值
df.fillna({'数学成绩': df['数学成绩'].mean(), '语文成绩': df['语文成绩'].median()}, inplace=True)
print(df)

通过以上步骤，我们成功地查找、显示并填充了数据集中的缺失值，从而为后续的数据分析和建模工作做好准备。