Question

我有一个如下所示的 Pandas 数据框，其中 A 列 是一系列字符串值，B 列 维护了A列中的值与前一行A列中的值不同。

每次 A 列的值发生变化时，我想复制前一行并为其分配 B 列的递增值。例如，使用上述输入数据框，输出将如下所示：

关于如何以有效的方式解决这个问题有什么想法吗？

Answer 1

通过 B 过滤最后重复的值，然后只移动 B 并分配回来，通过 concat 删除最后一行和最后一个连接在一起，并按索引排序：

df1 = (df[df['B'].ne(df['B'].shift(-1))]
         .assign(B = lambda x: x.B.shift(-1)).iloc[:-1].astype({'B':int}))

df = pd.concat([df, df1]).sort_index(ignore_index=True)
print (df)
    A  B
0   1  1
1   1  1
2   1  2
3  1b  2
4  1b  2
5  1b  2
6  1b  3
7   1  3

如果条件满足，熊猫复制行并赋值

1 个答案: