Python数据分析:使用Wilcoxon秩和检验比较厚度数据
Python数据分析:使用Wilcoxon秩和检验比较厚度数据
本代码示例演示了如何使用Python读取Excel文件,提取数据,并使用Wilcoxon秩和检验比较两组厚度数据。
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import scipy.stats as ss
data = pd.read_excel('../C题数据填充.xlsx', sheet_name=0)
data = data.values
plt.rcParams['font.sans-serif'] = ['FangSong']
# print(data)
pre = np.zeros([25])
lat = np.zeros([25])
for i in range(25):
pre[i] = data[2 * i, 2]
lat[i] = data[2 * i + 1, 2]
# print(prehoudu)
# print(lathoudu)
# myx=np.arange(25)
#
# plt.title('厚度',fontsize=20)
#
ax=plt.plot(myx, pre, c='red', marker='.')
bx=plt.plot(myx, lat, c='blue', marker='.')
# plt.show()
stat, p = ss.ranksums(pre, lat)
print(ss.ranksums(pre, lat))
# RanksumsResult(statistic=-5.539513675829845, pvalue=3.0331276062597446e-08)
代码解释
import matplotlib.pyplot as plt: 导入matplotlib库中的pyplot模块,并将其命名为plt,用于绘制图形。import numpy as np: 导入numpy库,并将其命名为np,用于进行数值计算和数组操作。import pandas as pd: 导入pandas库,并将其命名为pd,用于数据处理和分析。import scipy.stats as ss: 导入scipy库中的stats模块,并将其命名为ss,用于进行统计分析。data = pd.read_excel('../C题数据填充.xlsx', sheet_name=0): 使用pandas库中的read_excel函数读取Excel文件中的第一个表格数据,并将其存储在变量data中。data = data.values: 将data转换为numpy数组的形式,方便后续处理。plt.rcParams['font.sans-serif'] = ['FangSong']: 设置matplotlib的字体为仿宋。pre = np.zeros([25]): 创建一个长度为25的一维数组pre,用于存储厚度数据。lat = np.zeros([25]): 创建一个长度为25的一维数组lat,用于存储厚度数据。for i in range(25): pre[i] = data[2 * i, 2]: 使用循环遍历数组data中的数据,将每隔两行的第三列数据存储到数组pre中。for i in range(25): lat[i] = data[2 * i + 1, 2]: 使用循环遍历数组data中的数据,将每隔两行加一的第三列数据存储到数组lat中。stat, p = ss.ranksums(pre, lat): 使用scipy库中的ranksums函数计算两组数据pre和lat的Wilcoxon秩和检验的统计量和p值,并将结果分别存储在变量stat和p中。print(ss.ranksums(pre, lat)): 打印ranksums函数的返回结果,包括统计量和p值。
总结
该代码示例展示了如何使用Python进行数据分析,包括读取Excel文件、提取数据、进行统计分析等步骤。Wilcoxon秩和检验是一种非参数检验,适用于比较两个独立样本的秩和,特别适用于数据不服从正态分布或数据量较小的情况。
本示例代码仅供参考,您可以根据实际需要进行调整和修改。
原文地址: https://www.cveoy.top/t/topic/fM4L 著作权归作者所有。请勿转载和采集!