Python脚本实现Excel问卷调查数据分析
使用Python脚本分析Excel问卷调查数据
本文提供一个Python脚本示例,用于分析Excel格式的问卷调查数据。该脚本使用pandas库处理数据,并进行基本的数据清洗、预处理、选择题统计分析和开放题词频统计。
脚本代码:
import pandas as pd
# 读取Excel文件
data = pd.read_excel('调查问卷数据.xlsx')
# 数据清洗和预处理
# 假设问卷中的问题1-5为选择题,问题6为开放题
# 将选择题的答案转换为数值,方便后续分析
data['问题1'] = data['问题1'].map({'选项1': 1, '选项2': 2, '选项3': 3, '选项4': 4, '选项5': 5})
data['问题2'] = data['问题2'].map({'选项1': 1, '选项2': 2, '选项3': 3, '选项4': 4, '选项5': 5})
data['问题3'] = data['问题3'].map({'选项1': 1, '选项2': 2, '选项3': 3, '选项4': 4, '选项5': 5})
data['问题4'] = data['问题4'].map({'选项1': 1, '选项2': 2, '选项3': 3, '选项4': 4, '选项5': 5})
data['问题5'] = data['问题5'].map({'选项1': 1, '选项2': 2, '选项3': 3, '选项4': 4, '选项5': 5})
# 统计选择题的平均值和标准差
mean_values = data[['问题1', '问题2', '问题3', '问题4', '问题5']].mean()
std_values = data[['问题1', '问题2', '问题3', '问题4', '问题5']].std()
# 分析开放题的回答
# 统计开放题的词频
words = data['问题6'].str.split(expand=True).stack().value_counts()
# 输出结果
print('选择题平均值:')
print(mean_values)
print('
选择题标准差:')
print(std_values)
print('
开放题词频统计:')
print(words)
使用方法:
- 将以上代码保存为 .py 文件,例如 'data_analysis.py'。
- 将Excel问卷数据文件命名为 '调查问卷数据.xlsx',并将其与脚本文件放在同一目录下。
- 在命令行中运行脚本:
python data_analysis.py
脚本输出:
脚本将输出选择题的平均值、标准差以及开放题的词频统计结果。
注意事项:
- 本脚本仅提供基础数据分析框架,实际应用中需根据具体情况调整和扩展代码。
- 请确保已安装pandas库,可使用
pip install pandas命令安装。
原文地址: http://www.cveoy.top/t/topic/fx2C 著作权归作者所有。请勿转载和采集!