我有以下带有两个标题的数据框。我需要使用第二个标头(工业数据集)的字符串值创建一个新列
Region Industrial production
Italia 5669
Nord-ovest 1046
Piemonte 447
我的最终输出必须是:
Industrial production Region Industrial production
Industrial production Italia 5669
Industrial production Nord-ovest 1046
Industrial production Piemonte 447
答案 0 :(得分:0)
如果要将其作为索引,则可以使用:
df.set_index([list(df.columns.values)[1]],inplace = True)。
这将占用第二列,或者您可以直接输入第二列标题的名称。代码将接近于此。 希望对您有帮助
答案 1 :(得分:0)
在熊猫中,不能有两个名称完全相同的列,如果尝试创建另一个名为Industrial production
的列,它将覆盖现有的列:
In [2]: df
Out[2]:
Region Industrial production
0 Italia 5669
1 Nord-ovest 1046
2 Piemonte 447
In [3]: second = df.columns[1]
In [4]: second
Out[4]: 'Industrial production'
In [5]: df[second] = second
In [6]: df
Out[6]:
Region Industrial production
0 Italia Industrial production
1 Nord-ovest Industrial production
2 Piemonte Industrial production
您需要为此新列提供其他名称,例如Industrial production2
。然后,您可以如下创建它:
In [2]: df
Out[2]:
Region Industrial production
0 Italia 5669
1 Nord-ovest 1046
2 Piemonte 447
In [3]: second = df.columns[1]
In [3]: df[second + "2" ] = second
In [4]: df
Out[4]:
Region Industrial production Industrial production2
0 Italia 5669 Industrial production
1 Nord-ovest 1046 Industrial production
2 Piemonte 447 Industrial production
或者,您可以使用df.assign,如下所示:
In [3]: df
Out[3]:
Region Industrial production
0 Italia 5669
1 Nord-ovest 1046
2 Piemonte 447
In [4]: df = df.assign(**{df.columns[1] + "2": df.columns[1]})
In [5]: df
Out[5]:
Region Industrial production Industrial production2
0 Italia 5669 Industrial production
1 Nord-ovest 1046 Industrial production
2 Piemonte 447 Industrial production