与Pandas和一张CSV表建立并创建多对多关系

时间:2017-04-04 14:52:44

标签: python pandas many-to-many

我有一个csv,我导入了两个ID,ID1和ID2。两个ID之间存在多对多的关系。最后,我想创建两个东西,一个摘要和两个列表,列出与单个组相关的所有可能的ID1和ID2。

以下是我的意思的一个例子:

    ID1         ID2
0   46667523    9122532
1   55189732    9122532
2   71453880    9122532
3   77817617    9122532
4   77817617    79834910
5   79871820    9122532
6   79871820    79834910
7   98158277    9122532
8   98158277    458182615
9   134303192   9122532
10  187502299   458182615

此小样本中的所有这些ID代表一个单独的分组。我想添加一个新的列ID_New,对于这个例子,它们都是相同的。

    ID1         ID2       ID_New
0   46667523    9122532   1
1   55189732    9122532   1
2   71453880    9122532   1
3   77817617    9122532   1
4   77817617    79834910  1
5   79871820    9122532   1
6   79871820    79834910  1
7   98158277    9122532   1
8   98158277    458182615 1
9   134303192   9122532   1
10  187502299   458182615 1

最终的数据集不是很大,可能有100,000行,我如何创建和建立与熊猫的多对多关系?

0 个答案:

没有答案