Python 数据预处理:从文本中提取并转换“室、厅、卫”信息
Python 数据预处理:从文本中提取并转换'室、厅、卫'信息
本示例演示如何使用 Python 从文本数据中提取'室、厅、卫'信息,并将其转换为浮点类型。这对于房地产数据分析和机器学习非常有用。
data_copy[['室', '厅', '卫']] = data_copy['户型'].str.extract(r'(\d+)室(\d+)厅(\d+)卫')
data_copy['室'] = data_copy['室'].astype(float)
data_copy['厅'] = data_copy['厅'].astype(float)
data_copy['卫'] = data_copy['卫'].astype(float)
print(data_copy[['室', '厅', '卫']].head())
代码解释:
data_copy[['室', '厅', '卫']] = data_copy['户型'].str.extract(r'(\d+)室(\d+)厅(\d+)卫')使用正则表达式从'户型'列提取'室、厅、卫'信息,并将它们分别存入新的列'室', '厅', '卫'。data_copy['室'] = data_copy['室'].astype(float)将'室'列转换为浮点类型。data_copy['厅'] = data_copy['厅'].astype(float)将'厅'列转换为浮点类型。data_copy['卫'] = data_copy['卫'].astype(float)将'卫'列转换为浮点类型。print(data_copy[['室', '厅', '卫']].head())打印'室', '厅', '卫'列的前五行数据。
通过以上步骤,我们就成功地从文本数据中提取并转换了'室、厅、卫'信息,为后续的分析和建模奠定了基础。
原文地址: https://www.cveoy.top/t/topic/Kyc 著作权归作者所有。请勿转载和采集!