Python数据可视化: Bokeh库分析房贷与信用卡违约关系
Python数据可视化: Bokeh库分析房贷与信用卡违约关系
本案例使用Python的Bokeh库,通过条形图直观地展现有无房贷对于信用卡违约率的影响。
数据预处理
import pandas as pd
from bokeh.plotting import figure, show
df = pd.read_csv('train.csv')
df = df[['housing', 'default']]
df.dropna(inplace=True)
# 统计有房贷和无房贷的违约情况
has_housing_default = df[df['housing'] == 'yes']['default'].value_counts()
no_housing_default = df[df['housing'] == 'no']['default'].value_counts()
读取名为'train.csv'的数据集,提取'housing'和'default'列进行分析,并清除缺失值。然后,分别统计有房贷和无房贷用户的信用卡违约情况。
绘制条形图
p = figure(x_range=['Has Housing', 'No Housing'], plot_height=350, title='Default by Housing',
toolbar_location=None, tools='')
p.vbar(x='Has Housing', top=[has_housing_default[0], has_housing_default[1]], width=0.3, color='red', legend_label='No Default')
p.vbar(x='No Housing', top=[no_housing_default[0], no_housing_default[1]], width=0.3, color='blue', legend_label='Default')
p.xgrid.grid_line_color = None
p.legend.orientation = 'horizontal'
p.legend.location = 'top_center'
show(p)
使用Bokeh库创建条形图,分别展示有房贷和无房贷用户的信用卡违约和未违约数量。红色条形代表未违约用户,蓝色条形代表违约用户。
总结
通过该可视化分析,可以直观地对比有无房贷对信用卡违约率的影响,为相关决策提供数据支持。
原文地址: https://www.cveoy.top/t/topic/jkqZ 著作权归作者所有。请勿转载和采集!