请优化这段代码：import tkinter as tkimport osimport reimport docximport openpyxlfrom pptx import Presentationimport PyPDF2from bs4 import BeautifulSoupfrom sklearnfeature_extractiontext import TfidfVectorizer

将所有的导入语句放在文件开头，按照字母顺序排序。
在类内部方法中，将所有的控件创建和布局分开，按照控件类型分组，并按照从上到下、从左到右的顺序排列控件。
在搜索文档的代码中，将不同类型文件的处理逻辑分离出来，封装成不同的函数。
在搜索文档的代码中，尽量减少重复代码，例如将文本提取封装成一个函数，避免多次重复编写。
在搜索文档的代码中，将关键词分类的逻辑封装成一个函数。
在搜索文档的代码中，将不同算法的检索逻辑分离出来，封装成不同的函数。
在搜索文档的代码中，避免使用不必要的循环，例如在 TF-IDF 检索中将查询转化为矩阵后只需计算一次，避免在每个文件中重复计算。
在搜索文档的代码中，尽量使用列表推导式和生成器表达式，避免使用不必要的循环语句。
在搜索文档的代码中，避免使用多层嵌套的条件语句，可以使用函数式编程方式简化代码。