R语言关联规则挖掘:使用arules和arulesviz包分析数据集

本教程将演示如何在R语言中使用arules和arulesviz包进行关联规则挖掘。我们将以名为'breast3.txt'的数据集为例,展示如何安装、加载库,读取数据集,计算项集频率并绘制频繁度图。

1. 安装arules和arulesviz包

首先,需要安装arules和arulesviz包。在R中运行以下代码:

install.packages('arules')
install.packages('arulesviz')

2. 加载arules和arulesviz包

安装完成后,需要加载arules和arulesviz包。在R中运行以下代码:

library(arules)
library(arulesviz)

3. 读取数据集

使用read.transactions()函数读取名为'breast3.txt'的数据集,格式为'basket',分隔符为','。在R中运行以下代码:

trans <- read.transactions('breast3.txt', format = 'basket', sep = ',')

4. 查看数据集摘要信息

使用summary()函数查看数据集的摘要信息。在R中运行以下代码:

summary(trans)

5. 计算篮子大小

使用size()函数计算数据集的篮子大小。在R中运行以下代码:

basketsize <- size(trans)

6. 计算项集频率

使用itemFrequency()函数计算数据集中每个项集的频繁度。在R中运行以下代码:

itemFreq <- sort(itemFrequency(trans), decreasing = TRUE)

7. 绘制项集频繁度图

使用itemFrequencyPlot()函数绘制数据集中项集的频繁度图。

7.1 绘制所有项集的频繁度图

在R中运行以下代码:

itemFrequencyPlot(trans, support = 0.1)

7.2 绘制前10个频繁项集的频繁度图

在R中运行以下代码:

itemFrequencyPlot(trans, topN = 10, horiz = TRUE)

请确保已将名为'breast3.txt'的数据集放置在正确的工作目录中,并根据需要对代码进行适当的修改。希望对您有所帮助!

R语言关联规则挖掘:使用arules和arulesviz包分析数据集

原文地址: http://www.cveoy.top/t/topic/mgb 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录