在改进TF-IDF算法的过程中,需要计算词频位置信息的影响因子:ε和δ。当δ固定时,增加词频位置影响度可以提高初始范围内分类的准确率。然而,当影响度达到一定程度时,会夸大其实际作用效果,反而对分类效果产生负面影响。因此,词频位置信息的影响度存在一个准确率峰值,当ε小于该峰值时,分类准确率随ε增大而提高,当ε大于该峰值时,准确率反而下降。同样地,当ε固定时,距离中心位置较近或较远的词频都会对准确率造成不良影响,最优的δ值也存在一个准确率峰值。

改进TF-IDF算法中的词频位置影响因子ε和δ分析

原文地址: https://www.cveoy.top/t/topic/mZXZ 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录