我有一个数据集,其中包括每个受访者的三个变量及其完整的出生日期(日,月,年)。我想根据出生日期范围创建一个虚拟变量。例如,1948年12月1日至1949年8月31日之间出生的人应该被标记为干预组,而1949年9月1日至1950年5月31日之间出生的人应该是对照组。
我认为虚拟变量是表示这些组的好方法,其中1表示干预组,0表示比较组。
然而,并非所有数据集中的受访者都有这些出生日期,有些不能被视为干预或对照组参与者。
最好的方法是什么?后来,我想在回归分析中使用虚拟变量。在那里,我只能将这些参与者包括在比较或干预组中。
任何人都可以帮我这个吗?我无法自己找到解决方案。
谢谢!
答案 0 :(得分:0)
您可以通过语法创建虚拟变量,例如:
if(birthyear> = 1978)dummy = 1。 if(birthyear< 1978)dummy = 0。 执行。
我从未使用过该函数,但在spss中,您可以将变量定义为包含日期,我相信。我假设它使您能够以spss要求的任何格式使用日期,就好像是一个数字。