使用 Python 判断文件是否是文档文件格式,使用扩展名来判断内容。

要判断一个文件是否是文档文件格式,你可以使用 Python 的 magic 模块。magic 模块提供了一种通过文件内容来猜测文件类型的方法。

首先,你需要安装 magic 模块。你可以使用 pip 来安装它:

pip install python-magic

安装完成后,你可以使用下面的代码来判断文件是否是文档文件格式:

import magic

def is_document_file(file_path):
    mime = magic.from_file(file_path, mime=True)
    return 'text' in mime or 'application/pdf' in mime

file_path = 'path_to_your_file'
if is_document_file(file_path):
    print('该文件是文档文件格式')
else:
    print('该文件不是文档文件格式')

上述代码中,is_document_file 函数接受一个文件路径作为参数,并使用 magic.from_file 来获取文件的 MIME 类型。然后,它检查 MIME 类型中是否包含 'text''application/pdf',如果包含,则认为是文档文件格式。

请注意,这种方法并不是 100% 准确,因为它只是根据文件内容的特征来猜测文件类型。

Python 判断文件类型:不依赖扩展名,使用 magic 模块

原文地址: https://www.cveoy.top/t/topic/qDpe 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录