Python数据可视化: 使用Bokeh库分析不同职业的贷款利率
Python数据可视化: 使用Bokeh库分析不同职业的贷款利率
本案例使用Python的Bokeh库对贷款数据集进行可视化分析, 探索不同职业对3个月贷款利率的影响。
1. 数据准备:
- 使用Pandas库读取贷款数据集 (train.csv)。
- 从数据集中筛选出'lending_rate3m' (3个月贷款利率) 和 'job' (职业) 两列数据。
import pandas as pd
from bokeh.plotting import figure, show, output_file
df = pd.read_csv('train.csv')
data = df[['lending_rate3m', 'job']]
2. 数据分组与计算:
- 按照'job' (职业) 对数据进行分组。
- 计算每组的'lending_rate3m' (3个月贷款利率) 平均值。
grouped_data = data.groupby('job').mean().reset_index()
3. 创建可视化图形:
- 创建一个figure对象,设置图形标题、高度和宽度。
- 使用vbar()方法添加柱状图,x轴为职业,y轴为平均贷款利率。
- 设置x轴和y轴的标签。
p = figure(x_range=grouped_data['job'], plot_height=500, plot_width=800, title='不同职业的3个月贷款利率')
p.vbar(x=grouped_data['job'], top=grouped_data['lending_rate3m'], width=0.9, color='blue')
p.xaxis.axis_label = '职业'
p.yaxis.axis_label = '3个月贷款利率'
4. 输出和展示图形:
- 使用output_file()方法将图形输出到HTML文件。
- 使用show()方法显示图形。
output_file('lending_rate3m_by_job.html')
show(p)
通过运行以上代码,我们可以得到一个交互式的柱状图,清晰地展示不同职业对3个月贷款利率的影响。
原文地址: https://www.cveoy.top/t/topic/jknN 著作权归作者所有。请勿转载和采集!