在熊猫数据框中使用df.loc []与df [index]完成的列分配之间的差异

时间:2018-12-26 09:06:48

标签: python pandas

我的要求是替换一列的值,我想了解方法1与方法2的区别

df = pd.DataFrame(np.arange(10000000).reshape(1000000, 10))

方法1

%time df[8] = np.arange(1000000)

方法2

%time df.loc[:, 8] = np.arange(1000000)

推荐的方法是什么?为什么?

1 个答案:

答案 0 :(得分:0)

df.loc[:, 8]比直接索引df[8]
由于调用pandas.DataFrame.loc的费用很高,在这种情况下,:接受“切片对象”