在代码中,knn补充的数值都是一样的是因为在计算k个最近邻居时,只考虑了数值的距离,而没有考虑其他特征的影响。这样会导致k个最近邻居的数值非常接近,从而导致补充的数值也非常接近。

要完整解决这个问题,可以考虑以下几点:

  1. 考虑更多的特征:除了数值距离,还可以考虑其他特征的距离,例如时间特征、类别特征等。可以根据实际情况选择合适的特征进行距离计算。

  2. 考虑权重:对于不同的特征,可以根据其重要性给予不同的权重。例如,对于数值特征,可以给予较高的权重,而对于类别特征,可以给予较低的权重。

  3. 考虑更多的最近邻居:可以增加k的值,选择更多的最近邻居进行计算,这样可以更好地反映数据的分布情况。

  4. 考虑不同的距离度量方法:可以尝试不同的距离度量方法,例如欧氏距离、曼哈顿距离、余弦相似度等,选择合适的方法可以更好地衡量数据之间的相似性。

  5. 考虑使用其他的填充方法:除了knn算法,还可以考虑其他的填充方法,例如均值填充、中位数填充、回归填充等,根据实际情况选择合适的方法进行填充。

通过以上方法的综合应用,可以更好地解决knn补充的数值都是一样的问题,得到更准确的填充结果。

Excel 数据修复 - KNN 算法填充缺失值

原文地址: https://www.cveoy.top/t/topic/fB5R 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录