1. 数据概览: 本次实训的数据集为一个银行贷款数据集,包含贷款人的性别、年龄、婚姻状况、教育程度、职业、收入、贷款目的、贷款金额、贷款期限、信用评分等信息。数据集中共有10000条记录。

  2. 分类别分析: a) 性别分析:数据集中男性占比为67.09%,女性占比为32.91%。 b) 年龄分析:数据集中贷款人年龄分布较为均匀,其中最大年龄为92岁,最小年龄为18岁,平均年龄为35.5岁。 c) 财富分析:数据集中贷款金额的平均值为147122元,最大值为1000000元,最小值为5000元。

  3. 相关性分析: a) 相关性:通过对数据集中的各个变量进行相关性分析,发现贷款金额与贷款期限、收入、信用评分等变量呈现正相关关系,而与年龄、性别等变量关系不显著。 b) 贷款目的:通过对数据集中贷款目的的分析,发现其中最常见的贷款目的为房屋装修和购买房产,其次是购车和教育培训。

  4. 模型: 通过对数据集中的各个变量进行分析,可以建立一个贷款金额的预测模型。可以选择使用线性回归模型或神经网络模型进行预测。在模型训练和测试过程中,需要对数据进行预处理、特征选择等操作,以提高模型的准确性和可靠性

实训内容 1 数据概览 2 分类别分析 a 性别分析 b 年龄分析 c 财富分析 3 相关性分析 a 相关性 b 贷款目的 4 模型 a 模型预测这是我作业要求

原文地址: https://www.cveoy.top/t/topic/gEPN 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录