1. 上月套餐费用,流量,ARPU 等数值变量的缺失值处理可以根据具体情况选择用众数或均值进行填充。如果缺失值较少且对整体数据分布影响不大,可以使用均值进行填充;如果缺失值较多或对整体数据分布有较大影响,可以使用众数进行填充。

  2. 上次终端品牌,历史终端品牌偏好的类别型变量的缺失值处理可以使用"未知"或者"NaN"进行填充。这样可以保留缺失值的信息,并且在后续分析中可以将其作为一个独立的类别进行处理。

变量分箱以xx为间隔然后进行one-hot 编码3 用户状态根据业务状态进行筛选4同身份证下号码数 基于数据分布对于多号码用户进行特别处理5上月套餐费用流量ARPU 等数值变量的缺失值处理用众数均值6上次终端品牌历史终端品牌偏好的类别型变量的缺失值处理用nan用未知

原文地址: http://www.cveoy.top/t/topic/iY0v 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录