Python 代码:从 Excel 文件提取酒店评论并按酒店分类存储
以下是使用 Python 代码从 Excel 文件中提取酒店客户评论,并将每家酒店的'好的方面'和'差的方面'分别写入单独的文本文件,方便进行数据分析和整理的示例代码:
import openpyxl
import os
# 打开 Excel 文件
wb = openpyxl.load_workbook('hotel_comments.xlsx')
# 获取第一个工作表
ws = wb.active
# 创建存储文本文件的文件夹
if not os.path.exists('hotels_comments'):
os.mkdir('hotels_comments')
# 遍历每一行
hotel_name = ''
for row in ws.iter_rows(min_row=2):
if row[0].value: # 如果该行有酒店名称
hotel_name = row[0].value
# 创建酒店名称对应的txt文件
with open(f'hotels_comments/{hotel_name}.txt', 'w', encoding='utf-8') as f:
pass
if row[3].value: # 如果该行有好的方面
# 将好的方面写入txt文件
with open(f'hotels_comments/{hotel_name}.txt', 'a', encoding='utf-8') as f:
f.write(row[3].value + '\n')
if row[4].value: # 如果该行有差的方面
# 将差的方面写入txt文件
with open(f'hotels_comments/{hotel_name}.txt', 'a', encoding='utf-8') as f:
f.write(row[4].value + '\n')
代码解释:
- 导入库: 导入
openpyxl库用于读取 Excel 文件,以及os库用于创建文件夹。 - 打开 Excel 文件: 使用
openpyxl.load_workbook()方法打开 Excel 文件hotel_comments.xlsx。 - 获取工作表: 使用
wb.active获取第一个工作表。 - 创建文件夹: 使用
os.mkdir()方法创建名为hotels_comments的文件夹,用于存放生成的文本文件。 - 遍历每一行: 使用
ws.iter_rows(min_row=2)遍历每一行,从第二行开始,因为第一行可能是表头。 - 获取酒店名称: 如果当前行有酒店名称,则更新
hotel_name变量,并使用open()方法创建该酒店名称对应的文本文件,文件路径为hotels_comments/酒店名称.txt。 - 写入好的方面: 如果当前行有“好的方面”,则将内容写入对应的文本文件。
- 写入差的方面: 如果当前行有“差的方面”,则将内容写入对应的文本文件。
- 遍历完成: 代码遍历完所有行后,所有酒店的评论内容都分别存储在
hotels_comments文件夹下的文本文件中。
通过这段代码,您可以轻松地从 Excel 文件中提取酒店客户评论并按酒店分类存储,方便进行进一步的数据分析和处理。
原文地址: https://www.cveoy.top/t/topic/ooL1 著作权归作者所有。请勿转载和采集!