Apriori 和 FP-growth 算法中 min_support 和 min_threshold 的影响
在 Apriori 和 FP-growth 算法中,min_support 和 min_threshold 是两个重要的参数,用于控制频繁项集的选择。它们的变化会对算法的输出结果产生影响,具体如下:
-
min_support 的变化:
- 当 min_support 值较小时,会导致更多的项集被认为是频繁项集,因此算法的输出结果会包含更多的频繁项集。
- 当 min_support 值较大时,会导致较少的项集被认为是频繁项集,因此算法的输出结果会包含较少的频繁项集。
-
min_threshold 的变化:
- 在 FP-growth 算法中,min_threshold 用于控制频繁项集的选择,它是在构建 FP 树时对每个节点的条件模式基进行筛选的阈值。
- 当 min_threshold 值较小时,会导致更多的条件模式基被保留,因此算法的输出结果会包含更多的频繁项集。
- 当 min_threshold 值较大时,会导致较少的条件模式基被保留,因此算法的输出结果会包含较少的频繁项集。
总的来说,当 min_support 和 min_threshold 值较小时,算法的输出结果会包含更多的频繁项集;当 min_support 和 min_threshold 值较大时,算法的输出结果会包含较少的频繁项集。根据具体的应用需求,可以调整这两个参数来控制算法的输出结果。
原文地址: https://www.cveoy.top/t/topic/7Nd 著作权归作者所有。请勿转载和采集!