Python 使用决策树、逻辑回归和神经网络进行分类算法测试

这段代码主要使用Python进行分类算法的测试，使用了三种经典的分类算法：决策树、逻辑回归和神经网络，并分别对测试数据进行预测，并将结果保存为CSV文件。

首先，代码导入必要的库，包括pandas用于数据处理和sklearn库中用于实现三种分类算法的模型：DecisionTreeClassifier、LogisticRegression和MLPClassifier。

接着，代码读取了一个测试数据集test.csv，并将数据存储在变量X_test中，同时创建了三个空的DataFrame用于存储分类算法的结果：dt_test、lr_test和nn_test。

接下来，代码使用三个for循环分别对应三种分类算法。每个循环中，读取15个训练数据集，文件名格式为'train' + str(i) + '.csv'，并将其存储在变量train中。然后从训练集中分离出特征变量X_train和目标变量Y_train。

然后分别创建决策树分类器、逻辑回归分类器和神经网络分类器，并使用训练数据拟合模型。接着使用训练好的模型对测试数据X_test进行预测，并将结果存储在对应的结果DataFrame中。

最后，将三个结果DataFrame分别保存为'dt_test.csv'、'lr_test.csv'和'nn_test.csv'。

总体而言，这段代码的目的是使用三种分类算法对测试数据进行预测，并将结果保存为CSV文件，方便进一步分析和比较不同算法的性能。

以下是代码的具体实现：

import pandas as pd
from sklearn.linear_model import LogisticRegression
from sklearn.neural_network import MLPClassifier
from sklearn.tree import DecisionTreeClassifier

df1 = pd.read_csv(r'D:/大四/实训/测试训练集/test.csv')
test = pd.DataFrame(df1)
X_test = test.drop(['hostid', 'hostname', 'type'], axis=1)
dt_test = pd.DataFrame()
lr_test = pd.DataFrame()
nn_test = pd.DataFrame()

# 决策树
for i in range(15):
    df2 = pd.read_csv(r'D:/大四/实训/测试训练集/train' + str(i) + '.csv', encoding='utf-8')
    train = pd.DataFrame(df2)
    X_train = train.drop(['hostid', 'hostname', 'type'], axis=1)
    Y_train = train['type']

    dt_model = DecisionTreeClassifier()
    dt_model.fit(X_train, Y_train)
    result1 = dt_model.predict(X_test)
    dt_test['dt_result' + str(i)] = result1
dt_test.to_csv('D:/大四/实训/测试训练集/分类算法结果/dt_test.csv', index=False, encoding='utf-8')

# 逻辑回归
for j in range(15):
    df2 = pd.read_csv(r'D:/大四/实训/测试训练集/train' + str(j) + '.csv', encoding='utf-8')
    train = pd.DataFrame(df2)
    X_train = train.drop(['hostid', 'hostname', 'type'], axis=1)
    Y_train = train['type']

    lr_model = LogisticRegression()
    lr_model.fit(X_train, Y_train)
    result2 = lr_model.predict(X_test)
    lr_test['lr_result' + str(j)] = result2
lr_test.to_csv('D:/大四/实训/测试训练集/分类算法结果/lr_test.csv', index=False, encoding='utf-8')

# 神经网络
for k in range(15):
    df2 = pd.read_csv(r'D:/大四/实训/测试训练集/train' + str(k) + '.csv', encoding='utf-8')
    train = pd.DataFrame(df2)
    X_train = train.drop(['hostid', 'hostname', 'type'], axis=1)
    Y_train = train['type']

    nn_model = MLPClassifier()
    nn_model.fit(X_train, Y_train)
    result3 = nn_model.predict(X_test)
    nn_test['nn_result' + str(k)] = result3
nn_test.to_csv('D:/大四/实训/测试训练集/分类算法结果/nn_test.csv', index=False, encoding='utf-8')