我有一个如下所示的数据框:
Name A B C
D1 1 3 3
D2 2 4 4
D3 2 1 1
如何创建一个相同大小的新数据框,其中每个值都是今天的日期减去我第一个数据帧的值?
例如,如果今天是2018-04-27,我的新数据框将如下所示:
Name A B C
D1 2018-04-26 2018-04-24 2018-04-24
D2 2018-04-25 2018-04-23 2018-04-23
D3 2018-04-25 2018-04-26 2018-04-26
我认为解决方案将包含类似
的内容df2.iloc[1,1] = datetime.today() - timedelta(days=df1[1,1])
但是我遇到了各种类型的错误和循环原始df
的问题答案 0 :(得分:8)
import datetime as dt
from datetime import timedelta
import pandas as pd
df = pd.DataFrame({'Name':['D1','D2','D3'],'A':[1,2,2],'B':[3,4,1],'C':[3,4,1]})
df.set_index('Name', inplace=True)
df2 = df.applymap(lambda x: dt.date.today() - timedelta(days = x))
df2
A B C
Name
D1 2018-04-26 2018-04-24 2018-04-24
D2 2018-04-25 2018-04-23 2018-04-23
D3 2018-04-25 2018-04-26 2018-04-26
Applymap是您正在寻找的
编辑:添加导入,以避免日期时间导入问题here
答案 1 :(得分:1)
最好不要使用applymap
df.set_index('Name', inplace=True)
pd.to_datetime('today').date()-df.apply(pd.to_timedelta,unit='d')
Out[428]:
A B C
Name
D1 2018-04-26 2018-04-24 2018-04-24
D2 2018-04-25 2018-04-23 2018-04-23
D3 2018-04-25 2018-04-26 2018-04-26
答案 2 :(得分:0)
您可以展平DataFrame的值,以便可以将它们传递到pd.to_timedelta()
。这使您无需使用.applymap()
或.apply()
:
today = pd.to_datetime(dt.date(2018, 4, 27))
deltas = pd.to_timedelta(df.values.flatten(), unit='d')
df2 = pd.DataFrame(np.reshape((today - deltas).values, df2.shape),
index=df.index, columns=df.columns)
结果:
>>> df2
A B C
Name
D1 2018-04-26 2018-04-24 2018-04-24
D2 2018-04-25 2018-04-23 2018-04-23
D3 2018-04-25 2018-04-26 2018-04-26
>>> df2.dtypes
A datetime64[ns]
B datetime64[ns]
C datetime64[ns]
dtype: object