在 Stata 中,可以使用正则表达式来筛选出变量中观测值的数字部分。假设变量名为'obs',可以使用以下命令来实现:

gen numeric_part = regexs(0) if regexm(obs, '[0-9]+')

这个命令将创建一个新的变量'numeric_part',其中包含了'obs'变量中观测值的数字部分。在这个命令中,regexm(obs, '[0-9]+')用于判断'obs'变量的观测值是否包含数字部分,如果是,则返回1,否则返回0。regexs(0)用于提取数字部分。

如果想要将提取的数字部分替换原来的变量'obs',可以使用以下命令:

replace obs = regexs(0) if regexm(obs, '[0-9]+')

这样就将'obs'变量中的观测值替换为数字部分了。

Stata 正则表达式提取变量数字部分

原文地址: https://www.cveoy.top/t/topic/ez7I 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录