Question

我正在尝试将重复的行追加到一列中。复制基于某些列，这些列需要完全匹配才能将行声明为匹配项。问题是我们不能说有多少重复的行，所以解决方案需要通用。

我尝试了其他解决方案，但是它们基于某些user_id或key列。就我而言，除一列外的所有列都必须进行精确比较。并且附加的列应具有相同的列名。

我使用以下代码查找重复的行：

col = ['TITLE', 'ISSN', 'e-ISSN', 'ISBN', 'e-ISBN']
duplicated_data = data[data.duplicated(col, keep=False)]

现在我不知道下一步该怎么做

这是示例输入输出

输入数据：

------------------------------
DealName | Target | Category |
-----------------------------
ABC-XYZ  | ABC    | A        |
------------------------------
ABC-XYZ  | ABC    | B        |
------------------------------
ABC-XYZ  | None   | C        |

输出数据：

------------------------------------------------------------------------------------------
DealName | Target | Category |DealName | Target | Category 
---------------------------------------------------------------------------------------
ABC-XYZ  | ABC    | A        |ABC-XYZ  | ABC    | B

假设我已经设置了必须匹配前两列以选择行的条件，因为我们忽略了第二列中的第三行没有相同的值。

如何在熊猫中添加重复的行作为列？

0 个答案: