Python数据分析：使用Wilcoxon秩和检验比较厚度数据

本代码示例演示了如何使用Python读取Excel文件，提取数据，并使用Wilcoxon秩和检验比较两组厚度数据。

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import scipy.stats as ss

data = pd.read_excel('../C题数据填充.xlsx', sheet_name=0)
data = data.values
plt.rcParams['font.sans-serif'] = ['FangSong']
# print(data)
pre = np.zeros([25])
lat = np.zeros([25])
for i in range(25):
    pre[i] = data[2 * i, 2]
    lat[i] = data[2 * i + 1, 2]
# print(prehoudu)
# print(lathoudu)
# myx=np.arange(25)
#
# plt.title('厚度',fontsize=20)
#
ax=plt.plot(myx, pre, c='red', marker='.')
bx=plt.plot(myx, lat, c='blue', marker='.')
# plt.show()
stat, p = ss.ranksums(pre, lat)
print(ss.ranksums(pre, lat))
# RanksumsResult(statistic=-5.539513675829845, pvalue=3.0331276062597446e-08)

代码解释

import matplotlib.pyplot as plt: 导入matplotlib库中的pyplot模块，并将其命名为plt，用于绘制图形。
import numpy as np: 导入numpy库，并将其命名为np，用于进行数值计算和数组操作。
import pandas as pd: 导入pandas库，并将其命名为pd，用于数据处理和分析。
import scipy.stats as ss: 导入scipy库中的stats模块，并将其命名为ss，用于进行统计分析。
data = pd.read_excel('../C题数据填充.xlsx', sheet_name=0): 使用pandas库中的read_excel函数读取Excel文件中的第一个表格数据，并将其存储在变量data中。
data = data.values: 将data转换为numpy数组的形式，方便后续处理。
plt.rcParams['font.sans-serif'] = ['FangSong']: 设置matplotlib的字体为仿宋。
pre = np.zeros([25]): 创建一个长度为25的一维数组pre，用于存储厚度数据。
lat = np.zeros([25]): 创建一个长度为25的一维数组lat，用于存储厚度数据。
for i in range(25): pre[i] = data[2 * i, 2]: 使用循环遍历数组data中的数据，将每隔两行的第三列数据存储到数组pre中。
for i in range(25): lat[i] = data[2 * i + 1, 2]: 使用循环遍历数组data中的数据，将每隔两行加一的第三列数据存储到数组lat中。
stat, p = ss.ranksums(pre, lat): 使用scipy库中的ranksums函数计算两组数据pre和lat的Wilcoxon秩和检验的统计量和p值，并将结果分别存储在变量stat和p中。
print(ss.ranksums(pre, lat)): 打印ranksums函数的返回结果，包括统计量和p值。

总结

该代码示例展示了如何使用Python进行数据分析，包括读取Excel文件、提取数据、进行统计分析等步骤。Wilcoxon秩和检验是一种非参数检验，适用于比较两个独立样本的秩和，特别适用于数据不服从正态分布或数据量较小的情况。

本示例代码仅供参考，您可以根据实际需要进行调整和修改。