Stata 正则表达式提取变量数字部分
在 Stata 中,可以使用正则表达式来筛选出变量中观测值的数字部分。假设变量名为'obs',可以使用以下命令来实现:
gen numeric_part = regexs(0) if regexm(obs, '[0-9]+')
这个命令将创建一个新的变量'numeric_part',其中包含了'obs'变量中观测值的数字部分。在这个命令中,regexm(obs, '[0-9]+')用于判断'obs'变量的观测值是否包含数字部分,如果是,则返回1,否则返回0。regexs(0)用于提取数字部分。
如果想要将提取的数字部分替换原来的变量'obs',可以使用以下命令:
replace obs = regexs(0) if regexm(obs, '[0-9]+')
这样就将'obs'变量中的观测值替换为数字部分了。
原文地址: https://www.cveoy.top/t/topic/ez7I 著作权归作者所有。请勿转载和采集!