Python 数据清洗:删除索引列、空值并转换数据类型

在进行数据分析之前,通常需要对数据进行清洗。以下代码展示了如何使用 Python 中的 pandas 库进行数据清洗,包括删除索引列、空值,以及将字符串类型的价格和面积数据转换为浮点数。

代码示例:

data.drop('Unnamed: 0', axis=1, inplace=True) # 删除索引列
data.dropna(axis=0, how='any', inplace=True) # 删除所有包含空值的行

data['单价'] = data['单价'].map(lambda d: d.replace('元/平米', ''))
data['单价'] = data['单价'].astype(float)

data['总价'] = data['总价'].map(lambda z: z.replace('万', ''))
data['总价'] = data['总价'].astype(float)

data['建筑面积'] = data['建筑面积'].map(lambda p: p.replace('平米', ''))
data['建筑面积'] = data['建筑面积'].astype(float)

data

代码说明:

  1. data.drop('Unnamed: 0', axis=1, inplace=True): 删除名为'Unnamed: 0'的索引列。
  2. data.dropna(axis=0, how='any', inplace=True): 删除所有包含空值的行。
  3. data['单价'] = data['单价'].map(lambda d: d.replace('元/平米', '')): 将'单价'列中的'元/平米'字符串替换为空字符串。
  4. data['单价'] = data['单价'].astype(float): 将'单价'列转换为浮点类型。
  5. data['总价'] = data['总价'].map(lambda z: z.replace('万', '')): 将'总价'列中的'万'字符串替换为空字符串。
  6. data['总价'] = data['总价'].astype(float): 将'总价'列转换为浮点类型。
  7. data['建筑面积'] = data['建筑面积'].map(lambda p: p.replace('平米', '')): 将'建筑面积'列中的'平米'字符串替换为空字符串。
  8. data['建筑面积'] = data['建筑面积'].astype(float): 将'建筑面积'列转换为浮点类型。

通过以上代码,我们可以对数据进行清洗,并将价格和面积数据转换为数值类型,以便进行后续的数据分析。

Python 数据清洗:删除索引列、空值并转换数据类型

原文地址: https://www.cveoy.top/t/topic/9d5 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录