这是一段用 Stata 分析语言写成的代码,用于分析 CFPS2016 数据集中家庭成员的上网情况。

首先,代码通过循环生成 19 个家庭成员子数据集,每个子数据集包含一个家庭成员的相关信息,包括个人 ID(pid)和上网情况(ku201 和 ku202)。

接着,代码将原始的家庭数据集分为 19 份,每份包含一个家庭的信息,并通过循环将家庭数据集和家庭成员数据集进行合并,生成了 19 个合并后的数据集,每个数据集包含一个家庭的信息以及该家庭成员是否上网的信息。

最后,代码将所有的合并数据集进行合并,得到了一个整体的数据集,并使用 egen 命令生成了一个变量 rsum_x,该变量表示家庭成员是否有人上网,如果大于零,则表示有人上网,如果等于零,则表示无人上网。

代码解读:

* 合并家庭及其家庭成员数据集
* 1. 生成 19 个家庭成员子数据集
cd 'E:\0教学\!班级\222本科经济统计计量模型1234班\期末考试\cfps2016'
forvalues i = 1/19 {
	 use Cfps2016adult_201709.dta,clear
	 keep pid ku201 ku202
	 gen adult=1
	 rename pid pid_a_`i'
	 rename ku201 ku201_a_`i'
	 rename ku202 ku202_a_`i'
	 save a_`i'.dta,replace
}

* 孩子上网
use cfps2016child_201709.dta,clear

forvalues i = 1/19 {
	 use cfps2016child_201709.dta,clear
	 keep pid ku201 ku202
	 gen child=1
	 rename pid pid_a_`i'
	 rename ku201 ku201_a_`i'
	 rename ku202 ku202_a_`i'
	 save c_`i'.dta,replace
}

* 把家庭数据集分为 19 份
use Cfps2016famecon_201709.dta,clear
forvalues i = 1/18 {
	preserve 
	local j = `i'+1
	keep if pid_a_`i' >0 & pid_a_`j' <0
	display _N
	save famecon`i',replace
	restore
}
    keep if pid_a_19>0
	display _N
	save famecon19,replace
	
* 合并家庭及其家庭成员数据集
forvalues i = 1/19 {
    use famecon`i'.dta,clear
	    forvalues j = 1/`i' {
			merge m:1 pid_a_`j' using a_`j'.dta ,gen(_merge_a`j')
			merge m:1 pid_a_`j' using c_`j'.dta ,gen(_merge_c`j')		
			drop if _merge_a`j'==2 | _merge_c`j'==2			
			}
		keep if _merge_a`i'==3 | _merge_c`i'==3	
		display 'merge`i'=' _N
		save merge`i'.dta,replace //保存只有i个家人的样本
}

* 将所有 mergei 合并,append

use merge1,clear
forvalues i=2/19 {
    append using merge`i',nolabel
}
drop _merge*
save merge_total.dta,replace

*******
* 生成家庭成员是否上网 若 rsum_x 大于零则有人上网,若等于零则无人上网
egen rsum_x = rsum(ku201_a_2 ku202_a_2 ku201_a_3 ku202_a_3 ku201_a_4 ku202_a_4 ku201_a_5 ku202_a_5 ku201_a_6 ku202_a_6 ku201_a_7 ku202_a_7 ku201_a_8 ku202_a_8 ku201_a_9 ku202_a_9 ku201_a_10 ku202_a_10 ku201_a_11 ku202_a_11 ku201_a_12 ku202_a_12 ku201_a_13 ku202_a_13 ku201_a_14 ku202_a_14 ku201_a_15 ku202_a_15 ku201_a_16 ku202_a_16 ku201_a_17 ku202_a_17 ku201_a_18 ku202_a_18 k

基于该数据集的家庭成员上网情况分析方向:

  1. 家庭成员上网情况描述统计:

    • 计算有多少家庭成员上网、上网时间的分布等。
  2. 家庭成员上网与个人特征的关系:

    • 利用家庭成员的个人特征变量(如年龄、教育程度、职业等)与上网情况进行相关分析,探讨个人特征与上网的关系。
  3. 家庭成员上网与家庭特征的关系:

    • 利用家庭的特征变量(如家庭收入、家庭结构等)与上网情况进行相关分析,探讨家庭特征与上网的关系。
  4. 家庭成员上网的影响因素:

    • 利用回归分析等方法,探讨家庭成员上网的影响因素,比如个人特征、家庭特征、社会经济因素等。
  5. 家庭成员上网的影响效应:

    • 利用计量经济学模型,研究家庭成员上网对个人、家庭和社会经济发展的影响效应,比如对就业、教育、消费行为等方面的影响。

以上仅是一些分析的方向,具体的分析内容和结论需要根据具体问题和数据进行进一步的设计和分析。


原文地址: https://www.cveoy.top/t/topic/o6PU 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录