Python Bokeh数据可视化:婚姻状况与职业分布分析
Python Bokeh数据可视化:婚姻状况与职业分布分析
本案例使用Python的Bokeh库对数据集中的'marital'和'job'字段进行可视化分析,并通过合理的布局展示图表。
1. 数据准备
首先,我们导入必要的库并加载数据:
from bokeh.plotting import figure, show, output_file
import pandas as pd
df = pd.read_csv('train.csv')
2. 婚姻状况可视化
# 统计婚姻状况频数
marital_counts = df['marital'].value_counts()
marital_list = list(marital_counts.index)
marital_values = list(marital_counts.values)
# 创建画布
p1 = figure(x_range=marital_list, plot_height=400, title='婚姻状况分布')
# 绘制柱状图
p1.vbar(x=marital_list, top=marital_values, width=0.9)
p1.xgrid.grid_line_color = None
p1.y_range.start = 0
3. 职业分布可视化
# 统计职业频数
job_counts = df['job'].value_counts()
job_list = list(job_counts.index)
job_values = list(job_counts.values)
# 创建画布
p2 = figure(x_range=job_list, plot_height=400, title='职业分布')
# 绘制柱状图
p2.vbar(x=job_list, top=job_values, width=0.9)
p2.xgrid.grid_line_color = None
p2.y_range.start = 0
4. 布局与展示
# 使用row函数将两个图表水平排列
from bokeh.layouts import row
show(row(p1, p2))
通过以上步骤,我们使用Bokeh库实现了对数据集'marital'和'job'字段的可视化分析,并通过合理的布局展示图表,使得数据分析结果更加清晰易懂。
原文地址: https://www.cveoy.top/t/topic/jjXD 著作权归作者所有。请勿转载和采集!