R语言:利用缺失值创建新分类变量
若要利用三个不同的存在缺失值的现有变量创建新的分类变量,你可以使用dplyr包中的mutate函数和case_when函数。
首先,确保已加载dplyr包:library(dplyr)
然后,可以使用case_when函数根据现有变量的条件设置新的分类变量的取值。在case_when函数中,你可以使用is.na函数来检查现有变量是否为缺失值,并设置相应的取值。
以下是一个示例代码:
data <- data %>%
mutate(new_variable = case_when(
is.na(existing_variable1) | is.na(existing_variable2) | is.na(existing_variable3) ~ 'Missing',
existing_variable1 > threshold1 & existing_variable2 > threshold2 & existing_variable3 > threshold3 ~ 'Category A',
existing_variable1 <= threshold1 & existing_variable2 <= threshold2 & existing_variable3 <= threshold3 ~ 'Category B',
TRUE ~ 'Category C' # 处理其他情况,可根据需求修改
))
在上述代码中,我们使用case_when函数根据现有变量的条件设置新的分类变量的取值。首先,我们使用is.na函数检查现有变量是否为缺失值,并将对应的新变量设置为'Missing'。然后,我们根据不同的条件设置新变量的取值。最后,使用TRUE作为条件处理其他情况(如果有)。
请根据你的实际需求和数据的结构,修改变量名、条件和取值。确保你了解如何处理缺失值,并根据需要进行适当的修改。
原文地址: https://www.cveoy.top/t/topic/bx1v 著作权归作者所有。请勿转载和采集!