Python电影票房数据分析与可视化实训任务

电影是娱乐消费也是文化消费,数据分析师通过分析电影票房数据,可以分析大众的消费趋势,了解国内电影的消费占比。本实训任务将使用Python编程语言对电影票房数据进行分析和可视化,具体步骤如下:

  1. 数据准备:
  • 建立名为'data_analysis'的工程文件夹。
  • 将提供的电影票房数据文件'movies.csv'放置在工程文件夹的'data_file'子文件夹中,路径为'./data_file/movies.csv'。
  1. Python代码编写:
  • 创建名为'movie_analysis.py'的Python文件。
  • 导入必要的库:
    import csv
    import numpy as np
    import matplotlib.pyplot as plt
    
  • 读取数据文件并存储数据:
    movie_names = []
    box_office = []
    
    with open('./data_file/movies.csv', 'r', encoding='utf-8') as file:
        reader = csv.reader(file)
        for row in reader:
            movie_names.append(row[0])
            box_office.append(float(row[1]))
    
  • 数据清洗:删除票房数据中的NaN值(空值):
    clean_box_office = [x for x in box_office if not np.isnan(x)]
    
  • 设置坐标轴数据:
    x = np.arange(len(movie_names))
    y = np.array(clean_box_office)
    
  • 绘制柱状图:
    plt.bar(x, y)
    plt.xticks(x, movie_names, rotation=90)
    plt.xlabel('电影名')
    plt.ylabel('票房')
    plt.title('电影票房数据')
    plt.show()
    
  • 绘制折线图:
    plt.plot(x, y, marker='o', linestyle='-', color='b')
    plt.xticks(x, movie_names, rotation=90)
    plt.xlabel('电影名')
    plt.ylabel('票房')
    plt.title('电影票房数据')
    plt.grid(True)
    plt.show()
    

实施条件:

| 序号 | 设备、软件名称 | 规格/技术参数、用途 | 备注 | |---|---|---|---| | 1 | 大数据技术实训机房 | 测试场地 | 保证参考人员有足够间距 | | 2 | 计算机 | CPU 奔腾 4 以上,内存 2G 以上。 XP 或 Win7 操作系统、 linux 操作系统(ubuntu 或 centos) | 用于软件开发和软件部署,每人一台。 | | 3 | Pycharm2018.2 或 IntelliJ IDEA2018.2 | 开发工具 | 参考人员选用一种开发工具 | | 4 | Chrome55 或以上 | 浏览器 | |

考核时量: 120分钟

评分细则:

| 要求类别 | 评价项 | 分值 | 评分细则 | |---|---|---|---| | 技能要求 | 创建工程 | 5分 | 工程名称错误,扣2分;导入csv文件错误,扣3分。 | | | 创建文件及模块导入 | 5分 | 文件名错误,扣1分;导入csv模块错误,扣2分;导入matplotlib.pyplot模块错误,扣2分。 | | | 读取数据文件 | 15分 | 读取文件错误,扣10分;数据存入数组错误,扣5分。 | | | 删除数据 | 10分 | 未进行数据清洗空值判断,扣5分;未处理空值数据删除,扣5分。 | | | 设置坐标轴 | 15分 | x轴数据设置错误,扣5分;y轴数据设置错误,扣5分;票房数据格式转换错误,扣5分。 | | | 票房数据柱状图 | 20分 | 柱状图绘制显示错误,扣4分;若呈现的图中无标题,扣2分;柱状不显示,扣4分;无坐标名字显示等内容的设置,扣2分;显示内容不包含每个电影的票房,扣4分;数据显示错误,扣4分;无需跟参考答案一致,保存图片。 | | | 票房数据折线图 | 20分 | 折线图绘制显示错误,扣4分;若呈现的图中无标题,扣2分;折线不显示,扣4分;无坐标名字显示等内容的设置,扣2分;显示内容不包含每个电影的票房,扣4分;数据显示错误,扣4分;无需跟参考答案一致,保存图片。 | | 素养要求 | 项目文档 | 5分 | 按题目的考核要求提交考核结果的文档,文件命名和排版规范。 | | | 职业素养 | 5分 | 注重实训场所的安全管理规定,遵守操作规程和考场纪律。 |

Python电影票房数据分析与可视化实训任务

原文地址: https://www.cveoy.top/t/topic/fw1O 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录