Python数据分析:按日期和类别分析销售趋势及相关性
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei']
# 假设 merged_data 已经加载
# 按 '销售日期' 和 '分类名称' 分组并计算总销售额
category_date_sales = merged_data.groupby(['销售日期', '分类名称'])['销量(千克)'].sum().reset_index()
# 绘制随时间推移的销售趋势图
plt.figure(figsize=(16, 8))
for category in category_date_sales['分类名称'].unique():
subset = category_date_sales[category_date_sales['分类名称'] == category]
plt.plot(subset['销售日期'], subset['销量(千克)'], label=category)
plt.title('按时间分类的销售量趋势')
plt.xlabel('时间')
plt.ylabel('销量 (kg)')
plt.legend()
plt.grid(True)
plt.tight_layout()
plt.show()
# 创建透视表以进行相关性分析
correlation_data = category_date_sales.pivot(index='销售日期', columns='分类名称', values='销量(千克)')
# 计算相关矩阵
correlation_matrix = correlation_data.corr()
# 绘制相关矩阵的热图
plt.figure(figsize=(10, 6))
plt.title('不同类别销售量之间的相关性')
plt.xticks(rotation=45)
plt.yticks(rotation=45)
cax = plt.matshow(correlation_matrix, cmap='coolwarm', vmin=-1, vmax=1)
plt.colorbar(cax)
plt.xticks(range(len(correlation_matrix.columns)), correlation_matrix.columns)
plt.yticks(range(len(correlation_matrix.columns)), correlation_matrix.columns)
plt.show()
原文地址: https://www.cveoy.top/t/topic/eh7A 著作权归作者所有。请勿转载和采集!