Python 判断文件类型:不依赖扩展名,使用 magic 模块
使用 Python 判断文件是否是文档文件格式,不使用扩展名来判断内容。
要判断一个文件是否是文档文件格式,你可以使用 Python 的 magic 模块。magic 模块提供了一种通过文件内容来猜测文件类型的方法。
首先,你需要安装 magic 模块。你可以使用 pip 来安装它:
pip install python-magic
安装完成后,你可以使用下面的代码来判断文件是否是文档文件格式:
import magic
def is_document_file(file_path):
mime = magic.from_file(file_path, mime=True)
return 'text' in mime or 'application/pdf' in mime
file_path = 'path_to_your_file'
if is_document_file(file_path):
print('该文件是文档文件格式')
else:
print('该文件不是文档文件格式')
上述代码中,is_document_file 函数接受一个文件路径作为参数,并使用 magic.from_file 来获取文件的 MIME 类型。然后,它检查 MIME 类型中是否包含 'text' 或 'application/pdf',如果包含,则认为是文档文件格式。
请注意,这种方法并不是 100% 准确,因为它只是根据文件内容的特征来猜测文件类型。
原文地址: https://www.cveoy.top/t/topic/qDpe 著作权归作者所有。请勿转载和采集!