我有一个看起来像这样的df
df:
id dob
1 7/31/2018
2 6/1992
我想生成88799个随机日期以进入数据框中的列dob
至1960-01-01
之间的日期,同时保持格式1990-12-31
无时间戳。
我该怎么做?
我尝试过:
mm/dd/yyyy
答案 0 :(得分:3)
我会弄清楚您的日期范围内有多少天,然后选择该范围内的88799个随机整数,最后将其添加为最小时间unit='d'
的时间增量:
min_date = pd.to_datetime('1960-01-01')
max_date = pd.to_datetime('1990-12-31')
d = (max_date - min_date).days + 1
df['dob'] = min_date + pd.to_timedelta(pd.np.random.randint(d,size=88799), unit='d')
>>> df.head()
dob
0 1963-03-05
1 1973-06-07
2 1970-08-24
3 1970-05-03
4 1971-07-03
>>> df.tail()
dob
88794 1965-12-10
88795 1968-08-09
88796 1988-04-29
88797 1971-07-27
88798 1980-08-03
编辑,您可以使用.strftime('%m/%d/%Y')
设置日期格式,但是请注意,这会大大降低执行速度:
df['dob'] = (min_date + pd.to_timedelta(pd.np.random.randint(d,size=88799), unit='d')).strftime('%m/%d/%Y')
>>> df.head()
dob
0 02/26/1969
1 04/09/1963
2 08/29/1984
3 02/12/1961
4 08/02/1988
>>> df.tail()
dob
88794 02/13/1968
88795 02/05/1982
88796 07/03/1964
88797 06/11/1976
88798 11/17/1965