我有一个数据库,我有一个日期变量,一个id变量和一个城市变量。有时,id变量会在同一个日期和城市重复出现。 数据看起来像这样:
日期ID城市
2/1/2015 1 1
2/1/2015 1 1
2/1/2015 1 2
2015年2月2日1 1
2015年2月1日2 1
2015年2月2日2 1
我想知道每个ID存在多少天,确定每天都存在的ID,以及之后每个城市每天都存在的ID。 在上面的示例中,每天都存在ID 1和2,但每天每个城市仅存在ID 1。 谢谢!
答案 0 :(得分:0)
我想我刚刚做了我想做的事。 我所要做的就是:
by ID city date, sort: gen nvals = _n == 1
by ID city: replace nvals = sum(nvals)
by ID city : replace nvals = nvals[_N]