有一个excel文件标题是酒店名称客户整体评价入住时间好的方面差的方面五列文件内容是多家酒店的客户评论一个酒店的评论写在了一起不同的酒店之间空了一行需要读取这个excel文件将每个酒店的评论内容里面的好的方面差的方面这两列写入txt文本文件每行好的方面差的方面直接用一个空格符隔开就行不需要换行txt文本不要表头文件名是酒店名称;所有酒店的文本文件放在名字为hotels_comments这个文件夹下
import pandas as pd
读取excel文件
df = pd.read_excel('hotel_comments.xlsx')
获取空行的行数
empty_rows = df[df.isnull().all(axis=1)].index.tolist()
添加文件夹路径
folder_path = 'hotels_comments/'
遍历空行行数,将每个酒店的评论写入文本文件
for i in range(len(empty_rows)-1): # 获取酒店名称 hotel_name = df.iloc[empty_rows[i], 0] # 获取评论内容 comments = df.iloc[empty_rows[i]+1:empty_rows[i+1], 3:5].dropna(how='all').values.tolist() # 写入txt文件 with open(folder_path + hotel_name + '.txt', 'w') as f: for c in comments: f.write(' '.join(c) + ' '
原文地址: http://www.cveoy.top/t/topic/fJdo 著作权归作者所有。请勿转载和采集!