我是Python的新手。我已经通过pandas抓取了一个html表,我正在寻找插入具有重复字符串值的新列的方法,并将其设置为表的索引(如下:)。提醒表格很长:)。
原创df:
Age IQ
12 100
15 111
. .
. .
. .
. .
13 121
预期df"
Group Age IQ
A 12 100
A 15 111
. . .
. . .
. . .
. . .
A 13 121
答案 0 :(得分:2)
使用assign
创建数据框的副本,其中包含新列:
df.assign(Group='A')
Age IQ Group
0 12 100 A
1 15 111 A
2 13 121 A
您可以在之后重新排列列
df.assign(Group='A')[['Group'] + df.columns.tolist()]
Group Age IQ
0 A 12 100
1 A 15 111
2 A 13 121
但是,您可以使用insert
编辑数据框。这有额外的好处,允许您指定新列的去向。
df.insert(0, 'Group', 'A')
df
Group Age IQ
0 A 12 100
1 A 15 111
2 A 13 121