我有一个csv,我导入了两个ID,ID1和ID2。两个ID之间存在多对多的关系。最后,我想创建两个东西,一个摘要和两个列表,列出与单个组相关的所有可能的ID1和ID2。
以下是我的意思的一个例子:
ID1 ID2
0 46667523 9122532
1 55189732 9122532
2 71453880 9122532
3 77817617 9122532
4 77817617 79834910
5 79871820 9122532
6 79871820 79834910
7 98158277 9122532
8 98158277 458182615
9 134303192 9122532
10 187502299 458182615
此小样本中的所有这些ID代表一个单独的分组。我想添加一个新的列ID_New,对于这个例子,它们都是相同的。
ID1 ID2 ID_New
0 46667523 9122532 1
1 55189732 9122532 1
2 71453880 9122532 1
3 77817617 9122532 1
4 77817617 79834910 1
5 79871820 9122532 1
6 79871820 79834910 1
7 98158277 9122532 1
8 98158277 458182615 1
9 134303192 9122532 1
10 187502299 458182615 1
最终的数据集不是很大,可能有100,000行,我如何创建和建立与熊猫的多对多关系?