关联规则的确定性度量与实用性度量的分类及定义
关联规则的确定性度量主要包括支持度和置信度。支持度是指数据集中同时包含两个或多个项集的概率,即项集在数据集中出现的频率。置信度是指在包含某个项集的前提下,另一个项集出现的概率,即条件概率。支持度和置信度都是用于衡量关联规则的可靠程度。
实用性度量主要包括提升度和卡方值。提升度是指某个项集在另一个项集出现的条件下,出现的频率与在整个数据集中出现的频率之比。提升度的值越大,说明两个项集的关联性越强。卡方值是用来检验两个项集之间的关联性是否显著,其值越大则两个项集之间的关联性越显著。
综上所述,关联规则的确定性度量包括支持度和置信度,用于衡量关联规则的可靠程度;实用性度量包括提升度和卡方值,用于衡量关联规则的实用性和显著性。
原文地址: https://www.cveoy.top/t/topic/httV 著作权归作者所有。请勿转载和采集!