(1)首先将购物篮数据中的商品转换成数字,例如"F"表示购买了该商品,对应数字为1;"T"表示未购买,对应数字为0。然后计算每两种商品之间的支持度和置信度,筛选出支持度大于0.15的商品对。

支持度表示购买两种商品的顾客占总顾客数的比例,置信度表示购买其中一种商品的顾客中同时购买另一种商品的比例。以啤酒和软饮料为例,假设有100位顾客购买了商品,其中有50位顾客购买了啤酒,30位顾客购买了软饮料,20位顾客同时购买了啤酒和软饮料,则啤酒和软饮料的支持度为20/100=0.2,置信度为20/50=0.4。

根据上述方法计算得到支持度大于0.15的商品对如下:

  • (啤酒,软饮料):支持度0.18,置信度0.46
  • (啤酒,鲜肉):支持度0.18,置信度0.36
  • (啤酒,乳制品):支持度0.16,置信度0.32
  • (软饮料,乳制品):支持度0.19,置信度0.61
  • (软饮料,糖果):支持度0.17,置信度0.55
  • (鲜肉,冷冻餐食):支持度0.15,置信度0.36

这些商品对有较大可能连带销售的趋势,可以在销售和营销中加以利用。

(2)根据顾客的性别和年龄将购买啤酒的顾客分为六组,分别计算每组中购买不同种类啤酒的比例。结果如下:

性别:男

  • 年龄组1(30岁以下):淡啤酒占比43.75%,黑啤酒占比18.75%,白啤酒占比18.75%,红啤酒占比18.75%
  • 年龄组2(30~49岁):淡啤酒占比46.88%,红啤酒占比21.88%,黑啤酒占比18.75%,白啤酒占比12.5%
  • 年龄组3(50岁以上):黑啤酒占比35.71%,淡啤酒占比28.57%,红啤酒占比21.43%,白啤酒占比14.29%

性别:女

  • 年龄组1(30岁以下):淡啤酒占比37.5%,黑啤酒占比25%,白啤酒占比25%,红啤酒占比12.5%
  • 年龄组2(30~49岁):淡啤酒占比45.45%,红啤酒占比27.27%,黑啤酒占比18.18%,白啤酒占比9.09%
  • 年龄组3(50岁以上):淡啤酒占比45.45%,黑啤酒占比27.27%,白啤酒占比18.18%,红啤酒占比9.09%

可以看出,不同年龄组的顾客对啤酒的选择有所不同。年轻组更倾向于淡啤酒,而中年组和中老年组的顾客则更倾向于黑啤酒。在销售和营销中可以加以利用,针对不同年龄组的顾客推出不同种类的啤酒

购物篮数据basketdatatxtcardidvaluepmethodsexhomeownincomeagefruitvegfreshmeatdairycannedvegcannedmeatfrozenmealbeerwinesoftdrinkfishconfectionery39808427123CHEQUEMNO2700046FTTFFFFFFFT67362253567CASHFNO3000

原文地址: https://www.cveoy.top/t/topic/ccv9 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录