新闻真假分类器：使用逻辑回归模型进行训练和预测

这段代码是一个简单的新闻真假分类器，通过对新闻标题和正文进行预处理和特征提取，使用逻辑回归模型进行训练和预测。以下是代码的详细说明：

加载数据函数load_data(filename='news.csv')：读取csv文件中的数据，并使用joblib库将数据缓存到本地，返回一个pandas DataFrame对象。
数据处理函数data_process()：对DataFrame中的text列进行合并和处理，将标题和正文合并成一个字符串，去除停用词并进行词干提取，最后使用joblib库缓存处理后的DataFrame对象。
数据可视化函数data_visualization()：使用matplotlib库绘制条形图和词云，分别展示数据集中各类别的新闻数量和文本中最常出现的单词，并返回图像文件的绝对路径。
数据集划分和训练函数train(size=0.2)：使用sklearn库中的train_test_split函数将数据集划分为训练集和测试集，然后分别构建词袋模型和TF-IDF模型，并使用逻辑回归模型进行训练。最后使用joblib库将训练好的模型和测试集缓存到本地。
预测函数predict()：从本地缓存中加载训练好的模型和测试集，并使用模型对测试集进行预测，最后使用joblib库将预测结果缓存到本地。
评估函数evaluate()：从本地缓存中加载预测结果和测试集标签，并计算模型的准确率和混淆矩阵，并使用sns库绘制热力图展示混淆矩阵，最后返回混淆矩阵图像文件的绝对路径。

整个代码的流程是：加载数据 -> 数据处理 -> 数据可视化 -> 数据集划分和训练 -> 预测 -> 评估。其中，数据处理和数据可视化是可选的，可以根据具体需求选择是否执行。