#某星级酒店文本文件路径folder_path = 4star_hotels_comments_txt# 获取所有酒店评论文件名filenames = oslistdirfolder_path# 创建空表格df = pdDataFramecolumns=酒店名称+attributes# 创建保存文件with openfolder_path+4star_hotels_attrs_valuescsv
#导入模块 import os import pandas as pd from openpyxl import Workbook
#某星级酒店文本文件路径 folder_path = '4star_hotels_comments_txt/'
获取所有酒店评论文件名
filenames = os.listdir(folder_path)
创建空表格
df = pd.DataFrame(columns=['酒店名称']+attributes)
创建Excel文件
wb = Workbook() ws = wb.active
写入表头
header = ['酒店名称'] + attributes ws.append(header)
遍历每个酒店评论文件
for filename in filenames: # 获取酒店名称 hotel_name = filename.split('.')[0] # 获取酒店评论属性值 hotel_attrs_values = hotel_main(folder_path+filename) # 如果酒店评论属性值为"无",则将属性值都设置为"无" if hotel_attrs_values == "无": row_values = [hotel_name] + ["无"]*len(attributes) # 如果酒店评论属性值不为"无",则将属性值写入表格 else: row_values = [hotel_name] + [hotel_attrs_values.get(attr, "无") for attr in attributes] # 将一行数据写入Excel文件 ws.append(row_values)
保存Excel文件
wb.save(folder_path+'4star_hotels_attrs_values.xlsx'
原文地址: https://www.cveoy.top/t/topic/fJS6 著作权归作者所有。请勿转载和采集!