我希望在Stata中创建一个日期序列。搜索此论坛和其他人没有为Stata提供任何有用的代码。 R有很多答案,例如在this链接上显示。我想创建一个从2000年1月1日到2010年12月31日的序列。我该怎么做?
答案 0 :(得分:4)
日期在任何软件中都很棘手。在Stata中,与任何其他软件一样,没有什么可以替代仔细阅读文档。 help dates and times
回答了大多数问题。可能陷入困惑的怪癖是Stata中的date()
是用于创建每日日期变量的函数,而不是其他任何类型。从Stata 13开始,最好是新用户在寻找每日日期时使用同义函数daily()
。
也就是说,另一个函数在这里创建日期序列mdy()
更方便。
以下是一个例子:
clear
di mdy(1,1,2000)
di mdy(12,31,2010)
di mdy(12,31,2010) - mdy(1,1,2000)
set obs 4018
gen mydate = mdy(12,31,1999) + _n
format mydate %td
list in 1
list in L
注意:
mdy()
从表示月,日和年的参数创建每日日期变量。
_n
是观察号,1号。
因此,您需要计算出所需的开始日期和观察次数,然后只需将所需的常量添加到_n
即可。
Stata使用每日日期来源于1960年1月1日,但此解决方案并不取决于您的了解。
P.S。在一个现在删除的答案中,@凯蒂似乎要求一系列月度日期。这是一个经过编辑的版本:
当我尝试时,我的日期看起来像这个01jan2000,22jan2000。但 它们应该是每月:01jan2000,01feb2000。
如果你有月度数据,那么每个月的第一天的日常工作,至少就Stata而言,根本没有必要,也没有任何优势。实际上,通过创建这样的序列,您可以创建一个序列,其间隙长度分别为27,28,29和30天,因此甚至不是规则间隔的序列。这些差距将使Stata的许多分析变得尴尬而且有些不可能。类似的评论适用于宿舍。 (如果你有几个星期,相隔7天的每日日期是最好的框架,这是另一个故事。)
clear
di ym(2000, 1)
di ym(2010, 12)
di ym(2010, 1) - ym(2000,1)
set obs 121
gen mydate = ym(1999, 12) + _n
format mydate %tm
l in 1
l in L
注意:
ym()
从表示年份和月份的参数创建月度日期变量。
_n
是观察号,1号。
因此,您需要计算出所需的开始日期和观察次数,然后只需将所需的常量添加到_n
即可。
Stata使用月度日期来源于1960年1月,但此解决方案并不取决于您的了解。
编辑月末日常序列非常容易,您可能会因为没有立即看到而踢自己。假设我们希望2015年1月到2016年12月结束。那么每个月的结束只是下个月开始前一天。无需担心数月不同的长度或闰年。 Stata知道日历的细节,所以你不必告诉它们它们是什么。
. clear
. set obs 24
number of observations (_N) was 0, now 24
. gen mdate = ym(2015, 1) + _n
. gen ddate = dofm(mdate) - 1
. format %td ddate
. format %tm mdate
. list
+---------------------+
| mdate ddate |
|---------------------|
1. | 2015m2 31jan2015 |
2. | 2015m3 28feb2015 |
3. | 2015m4 31mar2015 |
4. | 2015m5 30apr2015 |
5. | 2015m6 31may2015 |
|---------------------|
6. | 2015m7 30jun2015 |
7. | 2015m8 31jul2015 |
8. | 2015m9 31aug2015 |
9. | 2015m10 30sep2015 |
10. | 2015m11 31oct2015 |
|---------------------|
11. | 2015m12 30nov2015 |
12. | 2016m1 31dec2015 |
13. | 2016m2 31jan2016 |
14. | 2016m3 29feb2016 |
15. | 2016m4 31mar2016 |
|---------------------|
16. | 2016m5 30apr2016 |
17. | 2016m6 31may2016 |
18. | 2016m7 30jun2016 |
19. | 2016m8 31jul2016 |
20. | 2016m9 31aug2016 |
|---------------------|
21. | 2016m10 30sep2016 |
22. | 2016m11 31oct2016 |
23. | 2016m12 30nov2016 |
24. | 2017m1 31dec2016 |
+---------------------+
答案 1 :(得分:1)
Stata使用相应的格式将日期作为整数处理,因此可以归结为确定所需的整数,生成序列并给出适当的格式。一种方法是:
clear all
set more off
// get corresponding integers
local start = date("2000/01/01", "YMD")
local end = date("2010/12/31", "YMD")
local ob = `end' - `start' + 1
// generate variable
set obs `ob'
egen date = seq(), from(`start') to(`end')
format %td date
list
请参阅help datetime
和[U] 24 Working with dates and times。