从字符串中提取并转换室厅卫数据 - Python 代码示例
import re
# 使用正则表达式提取室、厅、卫的数据
# 假设数据集中存在名为 '户型' 的列,包含类似 '2室1厅1卫' 的字符串
data_copy[['室', '厅', '卫']] = data_copy['户型'].str.extract(r'(\d+)室(\d+)厅(\d+)卫')
# 将房子室、厅、卫转换为浮点类型
data_copy['室'] = data_copy['室'].astype(float)
data_copy['厅'] = data_copy['厅'].astype(float)
data_copy['卫'] = data_copy['卫'].astype(float)
# 打印室、厅、卫的数据
print(data_copy[['室', '厅', '卫']].head())
代码说明:
- 导入正则表达式库:
import re - 使用正则表达式提取数据:
data_copy['户型'].str.extract(r'(\d+)室(\d+)厅(\d+)卫')使用正则表达式(\d+)室(\d+)厅(\d+)卫从'户型'列中提取数字,并将结果分别存储到新列'室','厅','卫'中。
- 将数据转换为浮点类型:
data_copy['室'] = data_copy['室'].astype(float)将'室'列中的字符串数据转换为浮点类型。- 同理,将
'厅'和'卫'列中的数据也转换为浮点类型。
- 打印结果:
print(data_copy[['室', '厅', '卫']].head())打印前五行数据。
注意:
- 该代码示例假设数据集中存在名为
'户型'的列,且该列包含类似'2室1厅1卫'的字符串。 - 实际应用中,您可能需要根据具体的数据格式和列名进行调整。
原文地址: https://www.cveoy.top/t/topic/KxB 著作权归作者所有。请勿转载和采集!