数据安全：数据集划分应在归一化之前进行

为了避免信息泄露，数据集的划分应该在归一化之前进行。这是因为，在数据预处理过程中，归一化操作会将数据映射到一个特定的范围内，例如0到1之间。如果在归一化之前进行数据集划分，那么训练集、验证集和测试集的数据分布将是不同的，这会导致信息泄露。例如，如果训练集中的数据被归一化到0到1之间，而测试集中的数据没有被归一化，那么模型可能会在训练集上表现很好，但在测试集上表现很差。

为了避免这种情况，应该先将数据集划分为训练集、验证集和测试集，然后再进行归一化操作。这样可以确保训练集、验证集和测试集的数据分布是一致的，从而减少信息泄露的风险。

此外，在进行数据集划分时，应该遵循一些原则，例如：

训练集应该包含大多数数据，用于训练模型。
验证集应该包含一小部分数据，用于调整模型参数。
测试集应该包含一小部分数据，用于评估模型的泛化能力。

通过遵循这些原则，可以有效地避免信息泄露，提高模型的泛化能力。