似乎有些操作可以在Pandas DataFrames上完成,但有些操作不能。
def add_col(df):
df['c'] = 5
def test_concat(df):
df = pd.concat([df,df], ignore_index=True)
如果我在DataFrame上运行这些函数,它会添加一个名为“c”的列,但它不会渲染与自身连接的原始DataFrame。
当然,我可以返回新的DataFrame,但我发现它正在影响性能。我并不是说这种行为一定是错的,但我想知道你们如何将大型函数重构为较小的子函数而不增加内存使用和处理时间。
答案 0 :(得分:1)
你问一个很好的问题......我想知道是否使用
df = df.append(df)
会降低性能影响吗?