R语言数据分析:计算泰坦尼克号成年乘客的平均舱位等级
R语言数据分析:计算泰坦尼克号成年乘客的平均舱位等级
本教程将演示如何使用R语言分析泰坦尼克号数据集,并计算成年乘客(年龄>=18岁)在不同生存状态下的平均舱位等级。
代码示例:
# 读取CSV文件
x <- read.csv('/usercode/files/titanic.csv')
# 筛选成年乘客数据
a <- x[x$Age >= 18, ]
# 按'Survived'列分组并计算平均舱位等级
mean_class_by_survived <- tapply(a$class, a$Survived, mean)
# 输出结果
print(mean_class_by_survived)
代码解释:
read.csv('/usercode/files/titanic.csv'): 读取名为'titanic.csv'的CSV文件,并将其存储在变量'x'中。a <- x[x$Age >= 18, ]: 从数据框'x'中筛选年龄大于等于18岁的乘客数据,并将结果存储在变量'a'中。mean_class_by_survived <- tapply(a$class, a$Survived, mean): 使用'tapply'函数按'Survived'列对'a$class'进行分组,并计算每个组的平均值。print(mean_class_by_survived): 打印最终结果,显示不同生存状态下成年乘客的平均舱位等级。
请确保在运行代码之前,已将'titanic.csv'文件上传至'/usercode/files/'目录下。
原文地址: https://www.cveoy.top/t/topic/b4vg 著作权归作者所有。请勿转载和采集!