R语言关联规则挖掘:使用arules和arulesviz包分析数据集
R语言关联规则挖掘:使用arules和arulesviz包分析数据集
本教程将演示如何在R语言中使用arules和arulesviz包进行关联规则挖掘。我们将以名为'breast3.txt'的数据集为例,展示如何安装、加载库,读取数据集,计算项集频率并绘制频繁度图。
1. 安装arules和arulesviz包
首先,需要安装arules和arulesviz包。在R中运行以下代码:
install.packages('arules')
install.packages('arulesviz')
2. 加载arules和arulesviz包
安装完成后,需要加载arules和arulesviz包。在R中运行以下代码:
library(arules)
library(arulesviz)
3. 读取数据集
使用read.transactions()
函数读取名为'breast3.txt'的数据集,格式为'basket',分隔符为','。在R中运行以下代码:
trans <- read.transactions('breast3.txt', format = 'basket', sep = ',')
4. 查看数据集摘要信息
使用summary()
函数查看数据集的摘要信息。在R中运行以下代码:
summary(trans)
5. 计算篮子大小
使用size()
函数计算数据集的篮子大小。在R中运行以下代码:
basketsize <- size(trans)
6. 计算项集频率
使用itemFrequency()
函数计算数据集中每个项集的频繁度。在R中运行以下代码:
itemFreq <- sort(itemFrequency(trans), decreasing = TRUE)
7. 绘制项集频繁度图
使用itemFrequencyPlot()
函数绘制数据集中项集的频繁度图。
7.1 绘制所有项集的频繁度图
在R中运行以下代码:
itemFrequencyPlot(trans, support = 0.1)
7.2 绘制前10个频繁项集的频繁度图
在R中运行以下代码:
itemFrequencyPlot(trans, topN = 10, horiz = TRUE)
请确保已将名为'breast3.txt'的数据集放置在正确的工作目录中,并根据需要对代码进行适当的修改。希望对您有所帮助!

原文地址: http://www.cveoy.top/t/topic/mgb 著作权归作者所有。请勿转载和采集!