Pandas 数据处理:如何处理缺失值 (NaN) 并填充

在数据分析过程中,经常会遇到数据集包含缺失值 (NaN) 的情况。Pandas 库提供了强大的工具来处理这些缺失值,本文将以一个简单的例子演示如何使用 Pandas 处理缺失值,并使用平均值和中位数等方法填充缺失值。

1. 查找并显示数据集中的空值和缺失值

data = {'学生姓名': ['张三', '李四', '王五', '赵六', '钱七'],
        '数学成绩': [85, None, 92, 78, 88],
        '语文成绩': [90, 86, None, 77, 91]}
df = pd.DataFrame(data)

# 查找并显示空值
res = df.isnull()
print(res)

2. 使用适当的方法填充缺失值

# 使用平均值填充数学成绩
df['数学成绩'].fillna(df['数学成绩'].mean(), inplace=True)

# 使用中位数填充语文成绩
df['语文成绩'].fillna(df['语文成绩'].median(), inplace=True)

print(df)

3. 显示填充后的数据集内容

# 使用字典方法批量填充缺失值
df.fillna({'数学成绩': df['数学成绩'].mean(), '语文成绩': df['语文成绩'].median()}, inplace=True)
print(df)

通过以上步骤,我们成功地查找、显示并填充了数据集中的缺失值,从而为后续的数据分析和建模工作做好准备。

Pandas 数据处理:如何处理缺失值 (NaN) 并填充

原文地址: https://www.cveoy.top/t/topic/dTTo 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录