某商店统计了上个季度10000笔交易记录,给出如题表3-2所示的统计信息:

题表3-2

  1. '牙刷' 在6000个事务中出现;
  2. '防晒霜' 在5000个事务中出现;3. '凉鞋' 在4000个事务中出现;4. '太阳镜' 在2000个事务中出现;
  3. '牙刷,防晒霜' 在1500个事务中出现;6. '牙刷,凉鞋' 在1000个事务中出现;7. '牙刷,太阳镜' 在250个事务中出现;
  4. '牙刷,防晒霜,凉鞋' 在600个事务中出现.

回答如下问题:

(1) 规则'牙刷→防晒霜' 与 '牙刷,防晒霜→凉鞋' 的置信度分别是多少?

(2) '牙刷' 和 '防晒霜' 是独立的吗?

(3) 计算 Lift('牙刷', '太阳镜')。

答:

(1) 规则'牙刷→防晒霜' 的置信度 = 支持度('牙刷,防晒霜') / 支持度('牙刷') = 1500 / 6000 = 0.25

规则'牙刷,防晒霜→凉鞋' 的置信度 = 支持度('牙刷,防晒霜,凉鞋') / 支持度('牙刷,防晒霜') = 600 / 1500 = 0.4

(2) '牙刷' 和 '防晒霜' 不独立,因为支持度('牙刷,防晒霜') = 1500 不等于支持度('牙刷') * 支持度('防晒霜') = 6000 * 5000 / 10000 = 3000

(3) Lift('牙刷', '太阳镜') = 支持度('牙刷,太阳镜') / 支持度('牙刷') * 支持度('太阳镜') = 250 / 10000 * 2000 / 10000 = 0.005


原文地址: https://www.cveoy.top/t/topic/oYq9 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录