#某星级酒店文本文件路径folder_path = 4star_hotels_comments_txt# 获取所有酒店评论文件名filenames = oslistdirfolder_path# 创建空表格df = pdDataFramecolumns=酒店名称+attributes# 遍历每个酒店评论文件for filename in filenames # 获取酒店名称 hotel
#某星级酒店文本文件路径 folder_path = '4star_hotels_comments_txt/'
获取所有酒店评论文件名
filenames = os.listdir(folder_path)
创建空表格
df = pd.DataFrame(columns=['酒店名称']+attributes)
创建保存文件
with open(folder_path+'4star_hotels_attrs_values.csv', 'w', encoding='utf-8') as f: # 写入表头 header = ','.join(['酒店名称'] + attributes) + '\n' f.write(header) # 遍历每个酒店评论文件 for filename in filenames: # 获取酒店名称 hotel_name = filename.split('.')[0] # 获取酒店评论属性值 hotel_attrs_values = hotel_main(folder_path+filename) # 如果酒店评论属性值为"无",则将属性值都设置为"无" if hotel_attrs_values == "无": row_values = [hotel_name] + ["无"]*len(attributes) # 如果酒店评论属性值不为"无",则将属性值写入表格 else: row_values = [hotel_name] + [hotel_attrs_values.get(attr, "无") for attr in attributes] # 将一行数据写入保存文件 row = ','.join(row_values) + '\n' f.write(row
原文地址: https://www.cveoy.top/t/topic/fJSG 著作权归作者所有。请勿转载和采集!