遍历文件夹Gpythonbooking情感分析hotels_comments_txt里面的每一个酒店评论txt文本文本名字是filenamehotel_attrs_values=hotel_mainfilename 函数得到酒店评论的6个属性值字典形式属性attributes = 员工素质 设施服务 清洁程度 舒适度 性价比 位置。创建一个表格表头是酒店名称和这6个属性酒店名称是filename将
import os import pandas as pd from hotel_main import hotel_main
folder_path = 'G:/python/booking情感分析/hotels_comments_txt/' attributes = ['员工素质', '设施服务', '清洁程度', '舒适度', '性价比', '位置']
获取所有酒店评论文件名
filenames = os.listdir(folder_path)
创建空表格
df = pd.DataFrame(columns=['酒店名称']+attributes)
遍历每个酒店评论文件
for filename in filenames: # 获取酒店名称 hotel_name = filename.split('.')[0]
# 获取酒店评论属性值
hotel_attrs_values = hotel_main(folder_path+filename)
# 如果酒店评论属性值为"无",则将属性值都设置为"无"
if hotel_attrs_values == "无":
row_values = [hotel_name] + ["无"]*len(attributes)
# 如果酒店评论属性值不为"无",则将属性值写入表格
else:
row_values = [hotel_name] + [hotel_attrs_values.get(attr, "无") for attr in attributes]
# 将一行数据添加到表格中
df.loc[len(df)] = row_values
将表格保存为csv文件
df.to_csv('hotel_attrs_values.csv', index=False
原文地址: https://www.cveoy.top/t/topic/fJiV 著作权归作者所有。请勿转载和采集!