商店交易记录分析:关联规则置信度与Lift值计算
某商店统计了上个季度10000笔交易记录,给出如题表3-2所示的统计信息:
题表3-2
- '牙刷' 在6000个事务中出现;
- '防晒霜' 在5000个事务中出现;3. '凉鞋' 在4000个事务中出现;4. '太阳镜' 在2000个事务中出现;
- '牙刷,防晒霜' 在1500个事务中出现;6. '牙刷,凉鞋' 在1000个事务中出现;7. '牙刷,太阳镜' 在250个事务中出现;
- '牙刷,防晒霜,凉鞋' 在600个事务中出现.
回答如下问题:
(1) 规则'牙刷→防晒霜' 与 '牙刷,防晒霜→凉鞋' 的置信度分别是多少?
(2) '牙刷' 和 '防晒霜' 是独立的吗?
(3) 计算 Lift('牙刷', '太阳镜')。
答:
(1) 规则'牙刷→防晒霜' 的置信度 = 支持度('牙刷,防晒霜') / 支持度('牙刷') = 1500 / 6000 = 0.25
规则'牙刷,防晒霜→凉鞋' 的置信度 = 支持度('牙刷,防晒霜,凉鞋') / 支持度('牙刷,防晒霜') = 600 / 1500 = 0.4
(2) '牙刷' 和 '防晒霜' 不独立,因为支持度('牙刷,防晒霜') = 1500 不等于支持度('牙刷') * 支持度('防晒霜') = 6000 * 5000 / 10000 = 3000
(3) Lift('牙刷', '太阳镜') = 支持度('牙刷,太阳镜') / 支持度('牙刷') * 支持度('太阳镜') = 250 / 10000 * 2000 / 10000 = 0.005
原文地址: https://www.cveoy.top/t/topic/oYq9 著作权归作者所有。请勿转载和采集!