数据挖掘算法实战:逻辑回归、决策树、神经网络、聚类、离群点挖掘和关联规则
数据挖掘算法实战:逻辑回归、决策树、神经网络、聚类、离群点挖掘和关联规则
第四部分 重要数据挖掘算法
2、逻辑回归的损失函数
3、逻辑回归的模型求解
4、代码实现
4.1.2 决策树分类算法
1、熵与信息增益
2、特征选择
3、决策树生成
4、决策树的剪枝策略
5、代码实现
结果
4.2 神经网络模型
1、神经网络算法Neural Network
结果
4.3 聚类算法
1、聚类算法K-MEANS
2、距离度量
3、K-MEANS算法
4、代码实现
结果
4.4 离群点挖掘
1、离群点挖掘算法
2、代码实现
结果
4.5 关联规则算法
4.5.1 关联规则算法
1、支持度和置信度
(1) 支持度(Support)
(2) 置信度(Confidence)
(3) 提升度(Lift)
(4) KULC 度量 + 不平衡比(IR)
4.5.2 Apriori 算法
1、原理
2、代码实现
输出结果
总结
本次实验让我更深入地了解了数据挖掘的一些重要算法,包括逻辑回归、决策树分类、神经网络模型、聚类算法、离群点挖掘和关联规则算法。通过学习算法的原理和代码实现,我能够更好地理解算法的优缺点和适用场景,对于实际的数据分析工作也更有帮助。
在实验过程中,我遇到了一些问题,例如在使用Python实现逻辑回归算法时,需要使用梯度下降法来求解模型,但是需要注意学习率的设置,否则可能会导致收敛速度过慢或者无法收敛。在实现决策树分类算法时,需要注意选择合适的特征选择方法和剪枝策略,否则可能会导致模型过拟合或者欠拟合。在实现K-MEANS聚类算法时,需要注意选择合适的距离度量方法和聚类数目K,否则可能会导致聚类效果不佳。
最后,我要感谢老师的悉心指导和教学,让我更好地掌握了数据挖掘算法的原理和实现方法。同时,我也要感谢同学们的合作和支持,让我们一起完成了这次实验。
原文地址: https://www.cveoy.top/t/topic/js7F 著作权归作者所有。请勿转载和采集!