我有一个dataframe列,其中包含10个不同的数字。通过pd.get_dummies
,我得到了10个新列,这些列名是数字。然后,我想用df = df.rename(columns={'0':'topic0'})
重命名这些名为column的数字,但是失败了。如何将这些列的名称从数字重命名为字符串?
答案 0 :(得分:2)
df = pd.DataFrame({'col':[1,5,7,8,3,6,5,8,9,10]})
df1 = pd.get_dummies(df['col']).add_prefix('topic')
print (df1)
topic1 topic3 topic5 topic6 topic7 topic8 topic9 topic10
0 1 0 0 0 0 0 0 0
1 0 0 1 0 0 0 0 0
2 0 0 0 0 1 0 0 0
3 0 0 0 0 0 1 0 0
4 0 1 0 0 0 0 0 0
5 0 0 0 1 0 0 0 0
6 0 0 1 0 0 0 0 0
7 0 0 0 0 0 1 0 0
8 0 0 0 0 0 0 1 0
9 0 0 0 0 0 0 0 1
答案 1 :(得分:0)
使用示例数据框,您可以执行以下操作:
d = {0: [1, 2], 1: [3, 4]}
df = pd.DataFrame(data=d)
您可以例如:
df.rename(index=str, columns={0: "a", 1: "c"})
然后使用此方法重命名其他列。
紧凑:
for x in range(3):
df.rename(index=str, columns={x: "topic"+str(x)})