Python 中文文件内容对比 - 查找重复内容
要比较两个中文文件的内容,并查找重复的部分,可以使用以下步骤:
- 打开第一个文件并读取内容。
with open('file1.txt', 'r', encoding='utf-8') as file1:
content1 = file1.read()
- 打开第二个文件并读取内容。
with open('file2.txt', 'r', encoding='utf-8') as file2:
content2 = file2.read()
- 将两个文件的内容分别转换为列表,其中每个元素为文件中的一行。
lines1 = content1.split('
')
lines2 = content2.split('
')
- 创建一个空列表,用于存储重复的行。
duplicates = []
- 遍历第一个文件的每一行,检查是否存在于第二个文件中。
for line in lines1:
if line in lines2 and line not in duplicates:
duplicates.append(line)
- 输出重复的行。
for line in duplicates:
print(line)
完整的代码如下所示:
with open('file1.txt', 'r', encoding='utf-8') as file1:
content1 = file1.read()
with open('file2.txt', 'r', encoding='utf-8') as file2:
content2 = file2.read()
lines1 = content1.split('
')
lines2 = content2.split('
')
duplicates = []
for line in lines1:
if line in lines2 and line not in duplicates:
duplicates.append(line)
for line in duplicates:
print(line)
请确保将 'file1.txt' 和 'file2.txt' 替换为实际的文件名,并确保文件编码与代码中指定的编码一致(例如,'utf-8')。
原文地址: http://www.cveoy.top/t/topic/fCeh 著作权归作者所有。请勿转载和采集!