以下是使用 Python 代码从 Excel 文件中提取酒店客户评论,并将每家酒店的'好的方面'和'差的方面'分别写入单独的文本文件,方便进行数据分析和整理的示例代码:

import openpyxl
import os

# 打开 Excel 文件
wb = openpyxl.load_workbook('hotel_comments.xlsx')

# 获取第一个工作表
ws = wb.active

# 创建存储文本文件的文件夹
if not os.path.exists('hotels_comments'):
    os.mkdir('hotels_comments')

# 遍历每一行
hotel_name = ''
for row in ws.iter_rows(min_row=2):
    if row[0].value:  # 如果该行有酒店名称
        hotel_name = row[0].value
        # 创建酒店名称对应的txt文件
        with open(f'hotels_comments/{hotel_name}.txt', 'w', encoding='utf-8') as f:
            pass
    if row[3].value:  # 如果该行有好的方面
        # 将好的方面写入txt文件
        with open(f'hotels_comments/{hotel_name}.txt', 'a', encoding='utf-8') as f:
            f.write(row[3].value + '\n')
    if row[4].value:  # 如果该行有差的方面
        # 将差的方面写入txt文件
        with open(f'hotels_comments/{hotel_name}.txt', 'a', encoding='utf-8') as f:
            f.write(row[4].value + '\n')

代码解释:

  1. 导入库: 导入 openpyxl 库用于读取 Excel 文件,以及 os 库用于创建文件夹。
  2. 打开 Excel 文件: 使用 openpyxl.load_workbook() 方法打开 Excel 文件 hotel_comments.xlsx
  3. 获取工作表: 使用 wb.active 获取第一个工作表。
  4. 创建文件夹: 使用 os.mkdir() 方法创建名为 hotels_comments 的文件夹,用于存放生成的文本文件。
  5. 遍历每一行: 使用 ws.iter_rows(min_row=2) 遍历每一行,从第二行开始,因为第一行可能是表头。
  6. 获取酒店名称: 如果当前行有酒店名称,则更新 hotel_name 变量,并使用 open() 方法创建该酒店名称对应的文本文件,文件路径为 hotels_comments/酒店名称.txt
  7. 写入好的方面: 如果当前行有“好的方面”,则将内容写入对应的文本文件。
  8. 写入差的方面: 如果当前行有“差的方面”,则将内容写入对应的文本文件。
  9. 遍历完成: 代码遍历完所有行后,所有酒店的评论内容都分别存储在 hotels_comments 文件夹下的文本文件中。

通过这段代码,您可以轻松地从 Excel 文件中提取酒店客户评论并按酒店分类存储,方便进行进一步的数据分析和处理。

Python 代码:从 Excel 文件提取酒店评论并按酒店分类存储

原文地址: https://www.cveoy.top/t/topic/ooL1 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录