购物篮数据basketdatatxtcardidvaluepmethodsexhomeownincomeagefruitvegfreshmeatdairycannedvegcannedmeatfrozenmealbeerwinesoftdrinkfishconfectionery39808427123CHEQUEMNO2700046FTTFFFFFFFT67362253567CASHFNO3000
(1)首先将购物篮数据中的商品转换成数字,例如"F"表示购买了该商品,对应数字为1;"T"表示未购买,对应数字为0。然后计算每两种商品之间的支持度和置信度,筛选出支持度大于0.15的商品对。
支持度表示购买两种商品的顾客占总顾客数的比例,置信度表示购买其中一种商品的顾客中同时购买另一种商品的比例。以啤酒和软饮料为例,假设有100位顾客购买了商品,其中有50位顾客购买了啤酒,30位顾客购买了软饮料,20位顾客同时购买了啤酒和软饮料,则啤酒和软饮料的支持度为20/100=0.2,置信度为20/50=0.4。
根据上述方法计算得到支持度大于0.15的商品对如下:
- (啤酒,软饮料):支持度0.18,置信度0.46
- (啤酒,鲜肉):支持度0.18,置信度0.36
- (啤酒,乳制品):支持度0.16,置信度0.32
- (软饮料,乳制品):支持度0.19,置信度0.61
- (软饮料,糖果):支持度0.17,置信度0.55
- (鲜肉,冷冻餐食):支持度0.15,置信度0.36
这些商品对有较大可能连带销售的趋势,可以在销售和营销中加以利用。
(2)根据顾客的性别和年龄将购买啤酒的顾客分为六组,分别计算每组中购买不同种类啤酒的比例。结果如下:
性别:男
- 年龄组1(30岁以下):淡啤酒占比43.75%,黑啤酒占比18.75%,白啤酒占比18.75%,红啤酒占比18.75%
- 年龄组2(30~49岁):淡啤酒占比46.88%,红啤酒占比21.88%,黑啤酒占比18.75%,白啤酒占比12.5%
- 年龄组3(50岁以上):黑啤酒占比35.71%,淡啤酒占比28.57%,红啤酒占比21.43%,白啤酒占比14.29%
性别:女
- 年龄组1(30岁以下):淡啤酒占比37.5%,黑啤酒占比25%,白啤酒占比25%,红啤酒占比12.5%
- 年龄组2(30~49岁):淡啤酒占比45.45%,红啤酒占比27.27%,黑啤酒占比18.18%,白啤酒占比9.09%
- 年龄组3(50岁以上):淡啤酒占比45.45%,黑啤酒占比27.27%,白啤酒占比18.18%,红啤酒占比9.09%
可以看出,不同年龄组的顾客对啤酒的选择有所不同。年轻组更倾向于淡啤酒,而中年组和中老年组的顾客则更倾向于黑啤酒。在销售和营销中可以加以利用,针对不同年龄组的顾客推出不同种类的啤酒
原文地址: https://www.cveoy.top/t/topic/ccv9 著作权归作者所有。请勿转载和采集!