我在熊猫中创建了一个名为“索引”的新列,该列为每行递增地增加了一个数字。
idx = 0
df.insert(idx, 'index', value=range(1,len(df)+ 1))
但是,我的索引当前从1开始,我想将其更改为从0开始。
当前输出:
'index'
1
2
3
4
5
...
我该怎么做?
答案 0 :(得分:3)
使用range(df)
:
idx = 0
df.insert(idx, 'index', value=range(len(df)))
或者为了获得更好的性能:
df.insert(idx, 'index', value=np.arange(len(df)))
如果要在最后一列中添加列:
df = df.assign('index', value=np.arange(len(df)))
df['index'] = np.arange(len(df)
但是如果要选择此列是必要的,请使用[]
:
print (df['index'])
因为带有点符号,所以它选择索引:
print (df.index)