使用Python脚本分析Excel问卷调查数据

本文提供一个Python脚本示例,用于分析Excel格式的问卷调查数据。该脚本使用pandas库处理数据,并进行基本的数据清洗、预处理、选择题统计分析和开放题词频统计。

脚本代码:

import pandas as pd

# 读取Excel文件
data = pd.read_excel('调查问卷数据.xlsx')

# 数据清洗和预处理
# 假设问卷中的问题1-5为选择题,问题6为开放题
# 将选择题的答案转换为数值,方便后续分析
data['问题1'] = data['问题1'].map({'选项1': 1, '选项2': 2, '选项3': 3, '选项4': 4, '选项5': 5})
data['问题2'] = data['问题2'].map({'选项1': 1, '选项2': 2, '选项3': 3, '选项4': 4, '选项5': 5})
data['问题3'] = data['问题3'].map({'选项1': 1, '选项2': 2, '选项3': 3, '选项4': 4, '选项5': 5})
data['问题4'] = data['问题4'].map({'选项1': 1, '选项2': 2, '选项3': 3, '选项4': 4, '选项5': 5})
data['问题5'] = data['问题5'].map({'选项1': 1, '选项2': 2, '选项3': 3, '选项4': 4, '选项5': 5})

# 统计选择题的平均值和标准差
mean_values = data[['问题1', '问题2', '问题3', '问题4', '问题5']].mean()
std_values = data[['问题1', '问题2', '问题3', '问题4', '问题5']].std()

# 分析开放题的回答
# 统计开放题的词频
words = data['问题6'].str.split(expand=True).stack().value_counts()

# 输出结果
print('选择题平均值:')
print(mean_values)
print('
选择题标准差:')
print(std_values)
print('
开放题词频统计:')
print(words)

使用方法:

  1. 将以上代码保存为 .py 文件,例如 'data_analysis.py'。
  2. 将Excel问卷数据文件命名为 '调查问卷数据.xlsx',并将其与脚本文件放在同一目录下。
  3. 在命令行中运行脚本: python data_analysis.py

脚本输出:

脚本将输出选择题的平均值、标准差以及开放题的词频统计结果。

注意事项:

  • 本脚本仅提供基础数据分析框架,实际应用中需根据具体情况调整和扩展代码。
  • 请确保已安装pandas库,可使用 pip install pandas 命令安装。
Python脚本实现Excel问卷调查数据分析

原文地址: http://www.cveoy.top/t/topic/fx2C 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录