Stata宏列表uniq扩展函数(从宏变量列表中删除重复项)

时间:2017-06-12 14:06:49

标签: list unique stata stata-macros

此问题已经过编辑,可以添加样本数据并清理(希望)每个反馈的一些不必要的步骤。

我从宽幅格式的纵向数据开始。我需要为多个不同的数据块进行子集化,重新整形和执行汇总步骤。我想创建宏变量,其中包含重组所需的varlists以及宽和长格式的其他重复步骤。重新整形的变量遵循(prefix)_(name)_#的一致命名模式。还有一些变量遵循相同的模式,不需要重新整形,变量是时不变的,并遵循其他命名约定。要生成样本数据:

set obs 1  
foreach t in 0 6 15 18 21 { 
foreach w in score postint postintc constime starttime { 
      gen p_`w'_`t' = 1 
    }
}
gen p_miles_0 = 1
gen p_hea_0 = 1
gen cons_age = 1

ds

我想为宽格式数据创建两个宏变量1)wide_varlist,其中变量以数字结尾,2)uniquestubs表示长格式数据,其中宏列表仅包含存根。我在使用宏列表扩展函数“uniq”在这里生成#2时遇到问题。到目前为止,这是我的代码。我的完整变量实际上要长得多。

使用宽格式varlist创建宏的步骤:

/* create varlist for wide format data a time point 0,6,15,18,21 */
ds  p_score_* p_postint_* p_postintc_* p_constime_* p_starttime_*
di "`r(varlist)'"
global wide_varlist `r(varlist)'

开始使用长格式varlist创建宏的步骤:

/*copy in wide format varlist*/
global stubs "$wide_varlist"

/*remove # - this results in a macro with 5 dups of same stub*/
foreach mo of numlist 0,6,15,18,21{
    global stubs : subinstr global stubs "`mo'" "", all
}

/*keep unique stubs*/
global uniquestubs : list uniq stubs

以上所有内容都有效,直到global uniquestubs : list uniq stubs为止,根本不会创建宏uniquestubs

我的情况与this question类似,但同样的解决方案对我不起作用。

有什么想法?感谢帮助。

1 个答案:

答案 0 :(得分:2)

在没有可重复的示例(b)的情况下,遵循您想要做的事情(a)有点困难,因为您的大部分代码只是将相同的varlist复制到不同的地方,这是一种分心。

我们可以通过创建玩具数据集来修复(a):

clear 
set obs 1 
foreach t in 0 6 15 18 21 { 
    foreach w in score postint postintc constime starttime { 
        gen p_`w'_`t' = 1 
    }
}

ds
p_score_0     p_score_6     p_score_15    p_score_18    p_score_21
p_postint_0   p_postint_6   p_postint_15  p_postint_18  p_postint_21
p_postintc_0  p_postintc_6  p_postintc~5  p_postintc~8  p_postintc~1
p_constime_0  p_constime_6  p_constim~15  p_constim~18  p_constim~21
p_starttim~0  p_starttim~6  p_startti~15  p_startti~18  p_startti~21

现在主要的困难似乎是你想要reshape long的存根。此代码足以满足玩具数据集的需要。无需使用相同的信息扫描更多变量名称。如果您没有所有时间点的所有变量,则可能需要更复杂的代码。

unab stubs:  p_*_0 
local stubs : subinstr local stubs "0" "", all 
di "`stubs'" 

p_score_ p_postint_ p_postintc_ p_constime_ p_starttime_

我不明白这里对全局变量的热情,但是,除了编程品味之外,你可以很容易地将最后的结果放在全球范围内。