Python脚本实现Excel问卷调查数据分析

使用Python脚本分析Excel问卷调查数据

本文提供一个Python脚本示例，用于分析Excel格式的问卷调查数据。该脚本使用pandas库处理数据，并进行基本的数据清洗、预处理、选择题统计分析和开放题词频统计。

脚本代码：

import pandas as pd

# 读取Excel文件
data = pd.read_excel('调查问卷数据.xlsx')

# 数据清洗和预处理
# 假设问卷中的问题1-5为选择题，问题6为开放题
# 将选择题的答案转换为数值，方便后续分析
data['问题1'] = data['问题1'].map({'选项1': 1, '选项2': 2, '选项3': 3, '选项4': 4, '选项5': 5})
data['问题2'] = data['问题2'].map({'选项1': 1, '选项2': 2, '选项3': 3, '选项4': 4, '选项5': 5})
data['问题3'] = data['问题3'].map({'选项1': 1, '选项2': 2, '选项3': 3, '选项4': 4, '选项5': 5})
data['问题4'] = data['问题4'].map({'选项1': 1, '选项2': 2, '选项3': 3, '选项4': 4, '选项5': 5})
data['问题5'] = data['问题5'].map({'选项1': 1, '选项2': 2, '选项3': 3, '选项4': 4, '选项5': 5})

# 统计选择题的平均值和标准差
mean_values = data[['问题1', '问题2', '问题3', '问题4', '问题5']].mean()
std_values = data[['问题1', '问题2', '问题3', '问题4', '问题5']].std()

# 分析开放题的回答
# 统计开放题的词频
words = data['问题6'].str.split(expand=True).stack().value_counts()

# 输出结果
print('选择题平均值：')
print(mean_values)
print('
选择题标准差：')
print(std_values)
print('
开放题词频统计：')
print(words)

使用方法：

将以上代码保存为 .py 文件，例如 'data_analysis.py'。
将Excel问卷数据文件命名为 '调查问卷数据.xlsx'，并将其与脚本文件放在同一目录下。
在命令行中运行脚本： python data_analysis.py

脚本输出：

脚本将输出选择题的平均值、标准差以及开放题的词频统计结果。

注意事项：

本脚本仅提供基础数据分析框架，实际应用中需根据具体情况调整和扩展代码。
请确保已安装pandas库，可使用 pip install pandas 命令安装。