将行附加到数据框时发生争执

时间:2017-04-26 14:52:33

标签: python pandas

我期待应用涉及2个dfs的函数:

df1:         A B C D E
   12/2/2001 3 4 2 3 4
   12/3/2001 5 5 5 4 6  
   12/4/2001 9 8 7 1 1

df_new = pd.DataFrame().reindex_like(df1)
df_new.loc[df_new.index[0]-pd.offsets.DateOffset(days=1)]=0
df_nuevo=df_new.sort_index()

for i in range(1,len(df_nuevo)):
    row=((df1.iloc[:i])*0.55)*((df_nuevo.iloc[:i-1])*0.45)
    df_nuevo.append(row)
print(df_nuevo)

我期望的输出df_nuevo填充了附加的行。实际上是由NaNs填补。有人可以帮忙吗?谢谢 。

这是当前的输出:

             A    B   C   D   E
   12/1/2001 0    0   0   0   0 
   12/2/2001 NaN NaN NaN NaN NaN
   12/3/2001 NaN NaN NaN NaN NaN
   12/4/2001 NaN NaN NaN NaN NaN

这个想法是,在有NaN的地方出现了代码部分中指定的公式的结果:行

2 个答案:

答案 0 :(得分:1)

如果您只是尝试根据df2以及df1的先前值迭代填写df2行,请简单重新制作您的公式(至少方式你最初用伪代码给它的是:

# create all-zeros df2 same shape as df1
df2 = df1.copy()
df2.loc[:,:] = 0

# iteratively compute df2
for i in range(len(df1)):
    df2.iloc[i] = df1.iloc[i] * .55 + df2.iloc[i-1] * .45 

对于上面给出的示例,df2的结果将是:

通过循环更新值可能会有所帮助:

i: 0
df1.iloc[i].values: array([ 3.,  4.,  2.,  3.,  4.])
df2.iloc[i - 1].values: array([ 0.,  0.,  0.,  0.,  0.])
resulting df2.iloc[i].values: array([ 1.65,  2.2 ,  1.1 ,  1.65,  2.2 ])

i: 1
df1.iloc[i].values: array([ 5.,  5.,  5.,  4.,  6.])
df2.iloc[i - 1].values: array([ 1.65,  2.2 ,  1.1 ,  1.65,  2.2 ])
resulting df2.iloc[i].values: array([ 3.4925,  3.74  ,  3.245 ,  2.9425,  4.29  ])

i: 2
df1.iloc[i].values: array([ 9.,  8.,  7.,  1.,  1.])
df2.iloc[i - 1].values: array([ 3.4925,  3.74  ,  3.245 ,  2.9425,  4.29  ])
resulting df2.iloc[i].values: array([ 6.521625,  6.083   ,  5.31025 ,  1.874125,  2.4805  ])

答案 1 :(得分:0)

这是你在找什么?

df1 = (df* 0.55 )+ (0.45 * df.shift())


                A       B       C       D       E
2001-12-02      NaN     NaN     NaN     NaN     NaN
2001-12-03      4.1     4.55    3.65    3.55    5.10
2001-12-04      7.2     6.65    6.10    2.35    3.25