import re

# 使用正则表达式提取室、厅、卫的数据
# 假设数据集中存在名为 '户型' 的列,包含类似 '2室1厅1卫' 的字符串
data_copy[['室', '厅', '卫']] = data_copy['户型'].str.extract(r'(\d+)室(\d+)厅(\d+)卫')

# 将房子室、厅、卫转换为浮点类型
data_copy['室'] = data_copy['室'].astype(float)
data_copy['厅'] = data_copy['厅'].astype(float)
data_copy['卫'] = data_copy['卫'].astype(float)

# 打印室、厅、卫的数据
print(data_copy[['室', '厅', '卫']].head())

代码说明:

  1. 导入正则表达式库: import re
  2. 使用正则表达式提取数据:
    • data_copy['户型'].str.extract(r'(\d+)室(\d+)厅(\d+)卫') 使用正则表达式 (\d+)室(\d+)厅(\d+)卫'户型' 列中提取数字,并将结果分别存储到新列 '室', '厅', '卫' 中。
  3. 将数据转换为浮点类型:
    • data_copy['室'] = data_copy['室'].astype(float)'室' 列中的字符串数据转换为浮点类型。
    • 同理,将 '厅''卫' 列中的数据也转换为浮点类型。
  4. 打印结果:
    • print(data_copy[['室', '厅', '卫']].head()) 打印前五行数据。

注意:

  • 该代码示例假设数据集中存在名为 '户型' 的列,且该列包含类似 '2室1厅1卫' 的字符串。
  • 实际应用中,您可能需要根据具体的数据格式和列名进行调整。
从字符串中提取并转换室厅卫数据 - Python 代码示例

原文地址: https://www.cveoy.top/t/topic/KxB 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录