我的要求是替换一列的值,我想了解方法1与方法2的区别
df = pd.DataFrame(np.arange(10000000).reshape(1000000, 10))
方法1
%time df[8] = np.arange(1000000)
方法2
%time df.loc[:, 8] = np.arange(1000000)
推荐的方法是什么?为什么?
答案 0 :(得分:0)
df.loc[:, 8]
比直接索引df[8]
慢
由于调用pandas.DataFrame.loc
的费用很高,在这种情况下,:
接受“切片对象” 。