我有以下数据框,我想在其中将索引从summary
重命名为id
:
summary student count
0 error 6
1 yes 1
2 no 1
3 other 9
我尝试过:
newdf = df.reset_index().rename(columns={df.index.name:'foo'})
给出:
summary index student count
0 0 error 6
1 1 yes 1
2 2 no 1
3 3 other 9
我也尝试过:df.index.rename('foo', inplace = True)
给出:
summary student count
foo
0 error 6
1 yes 1
2 no 1
3 other 9
我也尝试过:df.rename_axis('why', inplace = True)
给出:
summary student count
why
0 error 6
1 yes 1
2 no 1
3 other 9
当我做df.dtypes
时:
summary
student object
count init64
dtype: object
我想要什么:
id student count
0 error 6
1 yes 1
2 no 1
3 other 9
OR:
student count
0 error 6
1 yes 1
2 no 1
3 other 9
答案 0 :(得分:3)
您需要删除列名:
df.rename_axis(None, axis=1).rename_axis('id', axis=0)
##if pd.__version__ == 0.24.0
#df.rename_axis([None], axis=1).rename_axis('id')
问题在于'summary'
是您的列名。如果没有索引名称,则列名称将直接放在索引上方,这可能会引起误解:
import pandas as pd
df = pd.DataFrame([[1]*2]*4, columns=['A', 'B'])
df.columns.name = 'col_name'
print(df)
#col_name A B
#0 1 1
#1 1 1
#2 1 1
#3 1 1
当您尝试添加索引名称时,很明显'col_name'
确实是列名称。
df.index.name = 'idx_name'
print(df)
#col_name A B
#idx_name
#0 1 1
#1 1 1
#2 1 1
#3 1 1
但是并没有歧义:当您拥有索引名称时,列将提升一级,这使您可以区分索引名称和列名称。
df = pd.DataFrame([[1]*2]*4, columns=['A', 'B'])
df.index.name = 'idx_name'
print(df)
# A B
#idx_name
#0 1 1
#1 1 1
#2 1 1
#3 1 1
答案 1 :(得分:1)
您需要访问索引的属性
df.index.name = 'id'
原始
student count
summary
0 error 6
1 yes 1
2 no 1
3 other 9
固定df:
student count
id
0 error 6
1 yes 1
2 no 1
3 other 9
更新:似乎您已经为该列的索引命名。您应该使用
将其删除 df.columns.names = ''
答案 2 :(得分:0)
首先,您可以删除该列:
df = df.drop('summary', axis=1)
df['id'] = np.arange(df.shape[0])
df.set_index('id', inplace=True)
然后您可以获得预期的结果。