我有多个csv文件,此后我将其合并在一起,以便标识所有合并的csv文件中的单个csv数据,我希望在pandas中创建一个新列,其中新列应称为序列号。
我想在熊猫中创建一个新的列序列,并且应该根据Sequence列中的数据进行编号(例如csv中的每个新列为111111111,2222222222,33333333)。我还附加了csv文件的快照
Sequence Number
1
2
3
4
5
1
2
1
2
3
4
我想要这样的输出-
Serial Sequence Number
1 1
1 2
1 3
1 4
1 5
2 1
2 2
3 1
3 2
3 3
3 4
答案 0 :(得分:1)
将DataFrame.insert
用于第一个填充有布尔掩码的列,以将1
与Series.eq
(==
)进行比较,并将累积总和由Series.cumsum
进行比较:< / p>
df.insert(0, 'Serial', df['Sequence Number'].eq(1).cumsum())
print (df)
Serial Sequence Number
0 1 1
1 1 2
2 1 3
3 1 4
4 1 5
5 2 1
6 2 2
7 3 1
8 3 2
9 3 3
10 3 4