要比较两个中文文件的内容,并查找重复的部分,可以使用以下步骤:

  1. 打开第一个文件并读取内容。
with open('file1.txt', 'r', encoding='utf-8') as file1:
    content1 = file1.read()
  1. 打开第二个文件并读取内容。
with open('file2.txt', 'r', encoding='utf-8') as file2:
    content2 = file2.read()
  1. 将两个文件的内容分别转换为列表,其中每个元素为文件中的一行。
lines1 = content1.split('
')
lines2 = content2.split('
')
  1. 创建一个空列表,用于存储重复的行。
duplicates = []
  1. 遍历第一个文件的每一行,检查是否存在于第二个文件中。
for line in lines1:
    if line in lines2 and line not in duplicates:
        duplicates.append(line)
  1. 输出重复的行。
for line in duplicates:
    print(line)

完整的代码如下所示:

with open('file1.txt', 'r', encoding='utf-8') as file1:
    content1 = file1.read()

with open('file2.txt', 'r', encoding='utf-8') as file2:
    content2 = file2.read()

lines1 = content1.split('
')
lines2 = content2.split('
')

duplicates = []

for line in lines1:
    if line in lines2 and line not in duplicates:
        duplicates.append(line)

for line in duplicates:
    print(line)

请确保将 'file1.txt' 和 'file2.txt' 替换为实际的文件名,并确保文件编码与代码中指定的编码一致(例如,'utf-8')。

Python 中文文件内容对比 - 查找重复内容

原文地址: http://www.cveoy.top/t/topic/fCeh 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录