Jupyter Notebook 中的数据集预处理与划分

这段代码是在定义一些参数和调用一个名为'utils.get_data'的函数来获取数据集并将其分成训练集、验证集和测试集。其中，数据集名称、传感器名称、窗口长度、平滑程度和最大剩余使用寿命阈值等参数都被指定。获取的数据将被用于训练模型。

dataset = input('Enter dataset (FD001, FD002, FD003, FD004): ')
# sensors to work with: T30, T50, P30, PS30, phi
sensors = ['s_3', 's_4', 's_7', 's_11', 's_12']
# windows length
sequence_length = 30
# smoothing intensity
alpha = 0.1
# max RUL
threshold = 125

x_train, y_train, x_val, y_val, x_test, y_test = utils.get_data(dataset, sensors, 
sequence_length, alpha, threshold)

这段代码的目的是将原始数据预处理并划分成训练集、验证集和测试集，为机器学习模型的训练提供准备数据。具体步骤如下：

定义数据集名称：通过 input() 函数从用户输入中获取数据集名称。
定义传感器：定义一个列表 sensors，用于指定要使用的传感器。
定义窗口长度：定义变量 sequence_length，用于指定每个样本的时间窗口长度。
定义平滑程度：定义变量 alpha，用于指定平滑算法的强度。
定义最大剩余使用寿命阈值：定义变量 threshold，用于指定剩余使用寿命的最大值。
调用 utils.get_data 函数：使用定义好的参数调用 utils.get_data 函数，获取预处理后的数据并将其划分成训练集、验证集和测试集。

最终，x_train, y_train, x_val, y_val, x_test, y_test 分别对应训练集的输入数据、训练集的输出数据、验证集的输入数据、验证集的输出数据、测试集的输入数据和测试集的输出数据。这些数据将被用于训练和评估机器学习模型。