以下是使用Python批量统计文件夹下txt文件中的特定关键词词频,并将输出结果导出到Excel的示例代码:

import os
import re
import xlwt

# 定义关键词
keywords = ['apple', 'banana', 'orange']

# 定义Excel文件名和表头
filename = 'keywords_frequency.xls'
headers = ['文件名'] + keywords

# 创建Excel工作簿和工作表
workbook = xlwt.Workbook(encoding='utf-8')
worksheet = workbook.add_sheet('词频统计')

# 写入表头
for i, header in enumerate(headers):
    worksheet.write(0, i, header)

# 遍历文件夹
folder_path = 'path/to/folder'
for root, dirs, files in os.walk(folder_path):
    for file in files:
        if file.endswith('.txt'):
            file_path = os.path.join(root, file)
            # 统计词频
            with open(file_path, 'r', encoding='utf-8') as f:
                content = f.read()
                # 使用正则表达式匹配关键词
                keyword_counts = [len(re.findall(keyword, content)) for keyword in keywords]
                # 写入Excel
                row = [file] + keyword_counts
                worksheet.write(worksheet.last_used_row + 1, 0, row[0])
                for i, count in enumerate(row[1:]):
                    worksheet.write(worksheet.last_used_row, i+1, count)

# 保存Excel文件
workbook.save(filename)

在代码中,首先定义了要统计的关键词列表。然后创建了一个Excel工作簿和一个工作表,并写入了表头。接着使用os.walk()函数遍历指定文件夹下的所有文件,如果文件是txt文件,则打开文件,使用正则表达式匹配关键词,并将统计结果写入Excel表格中。最后保存Excel文件。运行代码后,会生成一个Excel文件,其中包含所有txt文件中关键词的词频统计结果。

何利用python批量统计文件夹下txt文件中的特定关键词词频并将输出结果导出到excel

原文地址: http://www.cveoy.top/t/topic/bjeo 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录