fastR2软件包中的Pitching2005数据集包含2005年大联盟中每位投手的赛季统计数据。使用该数据集的图形和数字摘要来探索两个联赛之间是否存在差异。请将您的注意力限制在至少参加了5场比赛的投手上变量GS代表game started。您可以选择感兴趣的统计数据。
以下是探索两个联盟之间存在差异的步骤:
- 加载fastR2软件包和Pitching2005数据集。
library(fastR2)
data(Pitching2005)
- 选择至少参加了5场比赛的投手,并将数据集分成两个子集,一个用于美国联盟(AL),一个用于国家联盟(NL)。
pitchers <- subset(Pitching2005, GS >= 5)
AL <- subset(pitchers, Lg == "AL")
NL <- subset(pitchers, Lg == "NL")
- 探索两个联盟之间的统计差异,例如ERA(防御率)和WHIP(每局被击中的安打和保送率)。
# AL和NL的ERA比较
boxplot(ERA ~ Lg, data = pitchers)
# AL和NL的WHIP比较
boxplot(WHIP ~ Lg, data = pitchers)
从上面的图表中可以看出,美国联盟的投手的防御率和每局被击中的安打和保送率似乎略高于国家联盟的投手。但是,我们需要使用统计测试来确定这些差异是否显著。
- 运行t检验,以检查AL和NL之间的差异是否显著。
# AL和NL的ERA之间的t检验
t.test(ERA ~ Lg, data = pitchers)
# AL和NL的WHIP之间的t检验
t.test(WHIP ~ Lg, data = pitchers)
根据t检验结果,我们可以得出结论,美国联盟的投手的防御率和每局被击中的安打和保送率与国家联盟的投手相比略高,但这些差异不显著(p > 0.05)。因此,我们不能得出两个联盟之间存在任何明显差异的结论
原文地址: https://www.cveoy.top/t/topic/fhfl 著作权归作者所有。请勿转载和采集!