Python 遍历酒店评论文本,提取属性值并创建表格
import os import pandas as pd from hotel_main import hotel_main
folder_path = 'G:/python/booking情感分析/hotels_comments_txt/' attributes = ['员工素质', '设施服务', '清洁程度', '舒适度', '性价比', '位置']
获取所有酒店评论文件名
filenames = os.listdir(folder_path)
创建空表格
df = pd.DataFrame(columns=['酒店名称']+attributes)
遍历每个酒店评论文件
for filename in filenames: # 获取酒店名称 hotel_name = filename.split('.')[0]
# 获取酒店评论属性值
hotel_attrs_values = hotel_main(folder_path+filename)
# 如果酒店评论属性值为'无',则将属性值都设置为'无'
if hotel_attrs_values == '无':
    row_values = [hotel_name] + ['无']*len(attributes)
# 如果酒店评论属性值不为'无',则将属性值写入表格
else:
    row_values = [hotel_name] + [hotel_attrs_values.get(attr, '无') for attr in attributes]
# 将一行数据添加到表格中
df.loc[len(df)] = row_values
将表格保存为csv文件
df.to_csv('hotel_attrs_values.csv', index=False)
原文地址: https://www.cveoy.top/t/topic/ooUt 著作权归作者所有。请勿转载和采集!