python 判断文档实际格式 doc还是docx
要判断一个文档的实际格式是doc还是docx,可以使用Python中的python-docx库来进行判断。
首先,安装python-docx库:
pip install python-docx
然后,使用以下代码来判断文档的实际格式:
from docx import Document
def check_document_format(file_path):
try:
document = Document(file_path)
return "docx"
except:
return "doc"
在上述代码中,我们尝试使用python-docx库加载给定的文档。如果加载成功,则说明文档的实际格式是docx;如果加载失败,则说明文档的实际格式是doc。
你可以调用check_document_format函数,并传入要判断的文档路径作为参数,它会返回文档的实际格式。
请注意,这种方法只能用于判断doc和docx文档格式,并且仅适用于包含文本的文档。对于其他类型的文档,如PDF或图片等,这种方法是无效的
原文地址: https://www.cveoy.top/t/topic/iNDU 著作权归作者所有。请勿转载和采集!