如何在Stata中创建日期序列?

时间:2014-12-16 09:31:26

标签: date stata

我希望在Stata中创建一个日期序列。搜索此论坛和其他人没有为Stata提供任何有用的代码。 R有很多答案,例如在this链接上显示。我想创建一个从2000年1月1日到2010年12月31日的序列。我该怎么做?

2 个答案:

答案 0 :(得分:4)

日期在任何软件中都很棘手。在Stata中,与任何其他软件一样,没有什么可以替代仔细阅读文档。 help dates and times回答了大多数问题。可能陷入困惑的怪癖是Stata中的date()是用于创建每日日期变量的函数,而不是其他任何类型。从Stata 13开始,最好是新用户在寻找每日日期时使用同义函数daily()。 也就是说,另一个函数在这里创建日期序列mdy()更方便。

以下是一个例子:

clear 
di mdy(1,1,2000)
di mdy(12,31,2010)
di mdy(12,31,2010) - mdy(1,1,2000)
set obs 4018
gen mydate = mdy(12,31,1999) + _n
format mydate %td
list in 1
list in L 

注意:

  1. mdy()从表示月,日和年的参数创建每日日期变量。

  2. _n是观察号,1号。

  3. 因此,您需要计算出所需的开始日期和观察次数,然后只需将所需的常量添加到_n即可。

  4. Stata使用每日日期来源于1960年1月1日,但此解决方案并不取决于您的了解。

  5. P.S。在一个现在删除的答案中,@凯蒂似乎要求一系列月度日期。这是一个经过编辑的版本:

      

    当我尝试时,我的日期看起来像这个01jan2000,22jan2000。但   它们应该是每月:01jan2000,01feb2000。

    如果你有月度数据,那么每个月的第一天的日常工作,至少就Stata而言,根本没有必要,也没有任何优势。实际上,通过创建这样的序列,您可以创建一个序列,其间隙长度分别为27,28,29和30天,因此甚至不是规则间隔的序列。这些差距将使Stata的许多分析变得尴尬而且有些不可能。类似的评论适用于宿舍。 (如果你有几个星期,相隔7天的每日日期是最好的框架,这是另一个故事。)

    clear 
    di ym(2000, 1)
    di ym(2010, 12)
    di ym(2010, 1) - ym(2000,1)
    set obs 121 
    gen mydate = ym(1999, 12) + _n
    format mydate %tm 
    l in 1
    l in L 
    

    注意:

    1. ym()从表示年份和月份的参数创建月度日期变量。

    2. _n是观察号,1号。

    3. 因此,您需要计算出所需的开始日期和观察次数,然后只需将所需的常量添加到_n即可。

    4. Stata使用月度日期来源于1960年1月,但此解决方案并不取决于您的了解。

    5. 编辑月末日常序列非常容易,您可能会因为没有立即看到而踢自己。假设我们希望2015年1月到2016年12月结束。那么每个月的结束只是下个月开始前一天。无需担心数月不同的长度或闰年。 Stata知道日历的细节,所以你不必告诉它们它们是什么。

      . clear
      
      . set obs 24 
      number of observations (_N) was 0, now 24
      
      . gen mdate = ym(2015, 1) + _n 
      
      . gen ddate = dofm(mdate) - 1 
      
      . format %td ddate
      
      . format %tm mdate 
      
      . list 
      
           +---------------------+
           |   mdate       ddate |
           |---------------------|
        1. |  2015m2   31jan2015 |
        2. |  2015m3   28feb2015 |
        3. |  2015m4   31mar2015 |
        4. |  2015m5   30apr2015 |
        5. |  2015m6   31may2015 |
           |---------------------|
        6. |  2015m7   30jun2015 |
        7. |  2015m8   31jul2015 |
        8. |  2015m9   31aug2015 |
        9. | 2015m10   30sep2015 |
       10. | 2015m11   31oct2015 |
           |---------------------|
       11. | 2015m12   30nov2015 |
       12. |  2016m1   31dec2015 |
       13. |  2016m2   31jan2016 |
       14. |  2016m3   29feb2016 |
       15. |  2016m4   31mar2016 |
           |---------------------|
       16. |  2016m5   30apr2016 |
       17. |  2016m6   31may2016 |
       18. |  2016m7   30jun2016 |
       19. |  2016m8   31jul2016 |
       20. |  2016m9   31aug2016 |
           |---------------------|
       21. | 2016m10   30sep2016 |
       22. | 2016m11   31oct2016 |
       23. | 2016m12   30nov2016 |
       24. |  2017m1   31dec2016 |
           +---------------------+
      

答案 1 :(得分:1)

Stata使用相应的格式将日期作为整数处理,因此可以归结为确定所需的整数,生成序列并给出适当的格式。一种方法是:

clear all
set more off

// get corresponding integers
local start = date("2000/01/01", "YMD")
local end = date("2010/12/31", "YMD")
local ob = `end' - `start' + 1

// generate variable
set obs `ob'
egen date = seq(), from(`start') to(`end')
format %td date

list

请参阅help datetime[U] 24 Working with dates and times