何利用python批量统计文件夹下txt文件中的特定关键词词频并将输出结果导出到excel
以下是使用Python批量统计文件夹下txt文件中的特定关键词词频,并将输出结果导出到Excel的示例代码:
import os
import re
import xlwt
# 定义关键词
keywords = ['apple', 'banana', 'orange']
# 定义Excel文件名和表头
filename = 'keywords_frequency.xls'
headers = ['文件名'] + keywords
# 创建Excel工作簿和工作表
workbook = xlwt.Workbook(encoding='utf-8')
worksheet = workbook.add_sheet('词频统计')
# 写入表头
for i, header in enumerate(headers):
worksheet.write(0, i, header)
# 遍历文件夹
folder_path = 'path/to/folder'
for root, dirs, files in os.walk(folder_path):
for file in files:
if file.endswith('.txt'):
file_path = os.path.join(root, file)
# 统计词频
with open(file_path, 'r', encoding='utf-8') as f:
content = f.read()
# 使用正则表达式匹配关键词
keyword_counts = [len(re.findall(keyword, content)) for keyword in keywords]
# 写入Excel
row = [file] + keyword_counts
worksheet.write(worksheet.last_used_row + 1, 0, row[0])
for i, count in enumerate(row[1:]):
worksheet.write(worksheet.last_used_row, i+1, count)
# 保存Excel文件
workbook.save(filename)
在代码中,首先定义了要统计的关键词列表。然后创建了一个Excel工作簿和一个工作表,并写入了表头。接着使用os.walk()函数遍历指定文件夹下的所有文件,如果文件是txt文件,则打开文件,使用正则表达式匹配关键词,并将统计结果写入Excel表格中。最后保存Excel文件。运行代码后,会生成一个Excel文件,其中包含所有txt文件中关键词的词频统计结果。
原文地址: http://www.cveoy.top/t/topic/bjeo 著作权归作者所有。请勿转载和采集!