Python Bokeh可视化分析:贷款利率与违约率关系
Python Bokeh可视化分析:贷款利率与违约率关系
本示例使用Python的Bokeh库对贷款利率(lending_rate3m)和违约率(default: job)进行可视化分析,探索两者之间的关系。
代码示例
from bokeh.plotting import figure, show, output_file
import numpy as np
import pandas as pd
# 读取数据
df = pd.read_csv('train.csv')
test = pd.read_csv('test.csv')
# 提取lending_rate3m和default: job列
data = df[['lending_rate3m', 'default: job']]
# 统计default: job的数量
job_counts = data['default: job'].value_counts()
# 创建绘图对象
p = figure(title='贷款利率与违约率关系', x_axis_label='贷款利率 (lending_rate3m)', y_axis_label='违约数量')
# 绘制散点图
p.circle(data['lending_rate3m'], data['default: job'], size=5)
# 添加平均线
p.line([np.mean(data['lending_rate3m']), np.mean(data['lending_rate3m'])], [0, job_counts[1]], line_width=2, line_color='red')
# 设置输出文件名
output_file('lending_rate3m_vs_default_job.html')
# 显示图形
show(p)
解释
- 代码首先读取数据,并提取所需的列。
- 然后,使用
value_counts()函数统计违约情况的数量。 - 接下来,创建一个绘图对象,并设置标题和轴标签。
- 使用
circle()函数绘制散点图,展示贷款利率和违约率之间的关系。 - 使用
line()函数添加一条垂直线,表示贷款利率的平均值。 - 最后,设置输出文件名,并使用
show()函数显示图形。
通过该可视化分析,可以直观地观察贷款利率和违约率之间的关系,为进一步的分析和决策提供依据。
原文地址: https://www.cveoy.top/t/topic/jjXr 著作权归作者所有。请勿转载和采集!