Python 数据清洗:删除索引列、空值并转换数据类型
Python 数据清洗:删除索引列、空值并转换数据类型
在进行数据分析之前,通常需要对数据进行清洗。以下代码展示了如何使用 Python 中的 pandas 库进行数据清洗,包括删除索引列、空值,以及将字符串类型的价格和面积数据转换为浮点数。
代码示例:
data.drop('Unnamed: 0', axis=1, inplace=True) # 删除索引列
data.dropna(axis=0, how='any', inplace=True) # 删除所有包含空值的行
data['单价'] = data['单价'].map(lambda d: d.replace('元/平米', ''))
data['单价'] = data['单价'].astype(float)
data['总价'] = data['总价'].map(lambda z: z.replace('万', ''))
data['总价'] = data['总价'].astype(float)
data['建筑面积'] = data['建筑面积'].map(lambda p: p.replace('平米', ''))
data['建筑面积'] = data['建筑面积'].astype(float)
data
代码说明:
data.drop('Unnamed: 0', axis=1, inplace=True): 删除名为'Unnamed: 0'的索引列。data.dropna(axis=0, how='any', inplace=True): 删除所有包含空值的行。data['单价'] = data['单价'].map(lambda d: d.replace('元/平米', '')): 将'单价'列中的'元/平米'字符串替换为空字符串。data['单价'] = data['单价'].astype(float): 将'单价'列转换为浮点类型。data['总价'] = data['总价'].map(lambda z: z.replace('万', '')): 将'总价'列中的'万'字符串替换为空字符串。data['总价'] = data['总价'].astype(float): 将'总价'列转换为浮点类型。data['建筑面积'] = data['建筑面积'].map(lambda p: p.replace('平米', '')): 将'建筑面积'列中的'平米'字符串替换为空字符串。data['建筑面积'] = data['建筑面积'].astype(float): 将'建筑面积'列转换为浮点类型。
通过以上代码,我们可以对数据进行清洗,并将价格和面积数据转换为数值类型,以便进行后续的数据分析。
原文地址: https://www.cveoy.top/t/topic/9d5 著作权归作者所有。请勿转载和采集!