Python Bokeh 可视化分析:不同职业分类中的婚姻状况占比
Python Bokeh 可视化分析:不同职业分类中的婚姻状况占比
本示例使用 Python 的 Bokeh 库,通过柱状图可视化分析不同职业分类中婚姻状况的占比。
代码实现
from bokeh.plotting import figure, show,output_file
import numpy as np
import pandas as pd
import pandas
df = pd.read_csv(r'/Users/fuchuanruo/Desktop/可视化作业/实践/train.csv')
test = pd.read_csv(r'/Users/fuchuanruo/Desktop/可视化作业/实践/test.csv')
# 数据预处理,计算不同job分类中marital状态的占比
job_marital = df.groupby(['job', 'marital'])['marital'].count()
job_total = df.groupby(['job'])['marital'].count()
job_marital_ratio = job_marital / job_total * 100
# 创建绘图空间
p = figure(title='不同职业分类中marital状态的占比', x_range=list(job_marital_ratio.index), plot_width=800, plot_height=400)
# 绘制柱状图
p.vbar(x=list(job_marital_ratio.index), top=job_marital_ratio.values, width=0.9, fill_color='orange')
# 设置x轴标签旋转角度,避免重叠
p.xaxis.major_label_orientation = np.pi/4
# 设置图像标题和x,y轴标签
p.title.text_font_size = '20pt'
p.xaxis.axis_label = '职业分类'
p.yaxis.axis_label = 'marital状态占比'
# 输出图像
output_file('job_marital_ratio.html')
show(p)
代码解析
- 数据预处理: 使用 pandas 库对数据进行分组统计,计算不同职业分类中婚姻状况的占比。
- 创建绘图空间: 使用
figure()函数创建绘图空间,设置标题、x 轴范围、绘图宽度和高度。 - 绘制柱状图: 使用
vbar()函数绘制柱状图,设置柱状图的 x 坐标、高度、宽度和填充颜色。 - 设置 x 轴标签旋转: 使用
xaxis.major_label_orientation属性设置 x 轴标签旋转角度,避免标签重叠。 - 设置图像标题和轴标签: 使用
title.text_font_size、xaxis.axis_label和yaxis.axis_label属性设置图像标题和 x, y 轴标签。 - 输出图像: 使用
output_file()函数指定输出文件,并使用show()函数显示图表。
总结
本示例展示了如何使用 Python 的 Bokeh 库进行数据可视化分析,通过柱状图直观地展现不同职业分类中婚姻状况的占比,并通过合理的布局和参数设置,使图表更加清晰易懂。
相关资源:
原文地址: https://www.cveoy.top/t/topic/jjXU 著作权归作者所有。请勿转载和采集!