Python数据分析:使用Wilcoxon秩和检验比较厚度数据

本代码示例演示了如何使用Python读取Excel文件,提取数据,并使用Wilcoxon秩和检验比较两组厚度数据。

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import scipy.stats as ss

data = pd.read_excel('../C题数据填充.xlsx', sheet_name=0)
data = data.values
plt.rcParams['font.sans-serif'] = ['FangSong']
# print(data)
pre = np.zeros([25])
lat = np.zeros([25])
for i in range(25):
    pre[i] = data[2 * i, 2]
    lat[i] = data[2 * i + 1, 2]
# print(prehoudu)
# print(lathoudu)
# myx=np.arange(25)
#
# plt.title('厚度',fontsize=20)
#
ax=plt.plot(myx, pre, c='red', marker='.')
bx=plt.plot(myx, lat, c='blue', marker='.')
# plt.show()
stat, p = ss.ranksums(pre, lat)
print(ss.ranksums(pre, lat))
# RanksumsResult(statistic=-5.539513675829845, pvalue=3.0331276062597446e-08)

代码解释

  • import matplotlib.pyplot as plt: 导入matplotlib库中的pyplot模块,并将其命名为plt,用于绘制图形。
  • import numpy as np: 导入numpy库,并将其命名为np,用于进行数值计算和数组操作。
  • import pandas as pd: 导入pandas库,并将其命名为pd,用于数据处理和分析。
  • import scipy.stats as ss: 导入scipy库中的stats模块,并将其命名为ss,用于进行统计分析。
  • data = pd.read_excel('../C题数据填充.xlsx', sheet_name=0): 使用pandas库中的read_excel函数读取Excel文件中的第一个表格数据,并将其存储在变量data中。
  • data = data.values: 将data转换为numpy数组的形式,方便后续处理。
  • plt.rcParams['font.sans-serif'] = ['FangSong']: 设置matplotlib的字体为仿宋。
  • pre = np.zeros([25]): 创建一个长度为25的一维数组pre,用于存储厚度数据。
  • lat = np.zeros([25]): 创建一个长度为25的一维数组lat,用于存储厚度数据。
  • for i in range(25): pre[i] = data[2 * i, 2]: 使用循环遍历数组data中的数据,将每隔两行的第三列数据存储到数组pre中。
  • for i in range(25): lat[i] = data[2 * i + 1, 2]: 使用循环遍历数组data中的数据,将每隔两行加一的第三列数据存储到数组lat中。
  • stat, p = ss.ranksums(pre, lat): 使用scipy库中的ranksums函数计算两组数据prelat的Wilcoxon秩和检验的统计量和p值,并将结果分别存储在变量statp中。
  • print(ss.ranksums(pre, lat)): 打印ranksums函数的返回结果,包括统计量和p值。

总结

该代码示例展示了如何使用Python进行数据分析,包括读取Excel文件、提取数据、进行统计分析等步骤。Wilcoxon秩和检验是一种非参数检验,适用于比较两个独立样本的秩和,特别适用于数据不服从正态分布或数据量较小的情况。

本示例代码仅供参考,您可以根据实际需要进行调整和修改。

Python数据分析:使用Wilcoxon秩和检验比较厚度数据

原文地址: https://www.cveoy.top/t/topic/fM4L 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录