要对这些数据进行相关分布规律分析,可以使用Python中的数据分析库和可视化库,例如numpy、pandas和matplotlib。

首先,将数据整理成两个列表,一个是蔬菜名称的列表,一个是销量的列表。代码如下:

vegetables = ['牛首生菜', '四川红香椿', '本地小毛白菜', '白菜苔', '苋菜', '云南生菜', '竹叶菜', '小白菜', '南瓜尖', '上海青', '萝卜叶', '牛首油菜', '茼蒿', '蔡甸藜蒿', '菜心', '木耳菜', '大白菜', '豌豆尖', '云南油麦菜', '马齿苋', '本地菠菜', '黄心菜(1)', '黑油菜', '本地上海青', '菠菜', '娃娃菜', '红薯尖', '枝江红菜苔', '黄花菜', '快菜', '随州泡泡青', '田七', '东门口小白菜', '外地茼蒿', '冰草', '紫苏', '薄荷叶', '蒲公英', '丝瓜尖', '奶白菜', '芥菜', '大芥兰', '面条菜', '甜白菜', '荠菜', '马兰头', '甘蓝叶', '洪山菜苔', '本地黄心油菜', '青菜苔', '小青菜(1)', '鲜粽子叶', '艾蒿', '奶白菜苗', '菊花油菜', '双沟白菜', '枝江红菜苔(份)', '云南生菜(份)', '云南油麦菜(份)', '茼蒿(份)', '菠菜(份)', '菜心(份)', '上海青(份)', '小青菜(2)', '洪山菜薹珍品手提袋', '洪山菜薹莲藕拼装礼盒', '鱼腥草(份)', '冰草(盒)', '紫苏(份)', '襄甜红菜苔(袋)', '白蒿', '鱼腥草', '竹叶菜(份)', '春菜', '槐花', '红薯尖(份)', '蔡甸藜蒿(份)', '红珊瑚(粗叶)', '红橡叶', '绿牛油', '保康高山大白菜', '黄心菜(2)', '苋菜(份)', '小白菜(份)', '小青菜(份)', '奶白菜(份)', '芝麻苋菜', '鲜粽叶', '鲜粽叶(袋)(1)', '外地茼蒿(份)', '龙牙菜', '黄白菜(1)', '大白菜秧', '木耳菜(份)', '芥兰', '油菜苔', '黄白菜(2)', '紫贝菜', '鲜粽叶(袋)(2)', '鲜粽叶(袋)(3)']
sales = [899.369, 333.223, 121.020, 718.676, 5100.061, 15910.461, 7240.764, 1707.303, 18.428, 7606.756, 415.325, 3836.566, 4110.162, 939.575, 4496.717, 1566.64, 19187.218, 85.048, 10305.364, 94.315, 0, 2911.299, 101.125, 569.697, 5216.461, 8982.000, 5159.433, 4962.454, 1.784, 91.272, 675.221, 45.252, 1543.478, 732.615, 16.337, 30.172, 7.568, 4.423, 14.227, 5816.308, 51.735, 7.480, 2404.977, 4685.261, 15.887, 3.390, 0.943, 25.000, 1375.122, 30.275, 3267.993, 6.320, 10.512, 16.829, 8.472, 2.886, 313.000, 104325.000, 848.000, 587.000, 6342.000, 2053.000, 3070.000, 296.000, 3.000, 3.000, 470.000, 29.000, 40.000, 41.000, 2.224, 28.601, 1076.000, 24.996, 9.300, 727.000, 65.000, 0.682, 0.419, 1.153, 6484.763, 1882.768, 426.000, 341.000, 4057.000, 6931.000, 9.381, 6.009, 200.000, 127.000, 186.381, 155.496, 16.538, 27.000, 0.671, 40.726, 7987.990, 27.002, 8.000, 128.000]

接下来,可以使用pandas库创建一个数据框来存储这些数据,并进行排序和计算相关性。代码如下:

import pandas as pd

data = pd.DataFrame({'蔬菜名称': vegetables, '销量': sales})
data_sorted = data.sort_values(by='销量', ascending=False)

correlation = data_sorted['销量'].corr(data_sorted.index)
print('销量与蔬菜名称的相关系数为:', correlation)

最后,使用matplotlib库绘制柱状图来可视化销量数据。代码如下:

import matplotlib.pyplot as plt

plt.figure(figsize=(12, 6))
plt.bar(data_sorted['蔬菜名称'], data_sorted['销量'])
plt.xticks(rotation=90)
plt.xlabel('蔬菜名称')
plt.ylabel('销量')
plt.title('蔬菜销量')
plt.show()

这样就完成了相关分布规律分析并将结果可视化。

蔬菜销量数据分析:哪些蔬菜最受欢迎?

原文地址: https://www.cveoy.top/t/topic/nCPy 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录