Pandas在数据帧之间进行多对多查找

时间:2018-05-21 10:12:03

标签: python-3.x pandas merge many-to-many

我正在尝试将有关计算机名称的复杂信息汇总到一起,它所属的部门,它提供的服务是什么。我找不到答案或类似的问题,而 pd.merge()上的熊猫文档对我来说并不清楚。

我有一个名为 server_list 的数据框,其中每个服务器多次出现

  Server     Platform    Package    Version
0 UK1010     Unix        Java       1.1
1 UK1010     Unix        Java       4.1
2 UK1010     Unix        Java       5.0
3 UK1011     Windows     Java       1.2
4 UK1011     Windows     Java       4.4
...

我有一个名为应用程序的数据框,如下所示:

  Server     Department    Application    Environment
0 UK1010     Accounting    TaxMe          PROD
1 UK1010     Audit         TaxCheck       PROD
2 UK1010     CustomerForm  FillIt         PROD
...

每个服务器与部门,应用程序,环境有多种关系

我希望实现的是多对多关系,我可以从应用程序中提取所有信息(所有行),并以某种方式将其与 server_list 所以项目重复,除非有更好的方法?这是我希望实现的目标,但如果这是正确的方法,则不确定如何设置 pd.merge()

  Server     Platform    Package    Version   Department   Application  Environment
0 UK1010     Unix        Java       1.1       Accounting   TaxMe        PROD
1 UK1010     Unix        Java       1.1       Audit        TaxCheck     PROD
2 UK1010     Unix        Java       1.1       CustomerForm FillIt       PROD
3 UK1010     Unix        Java       4.1       Accounting   TaxMe        PROD
4 UK1010     Unix        Java       4.1       Audit        TaxCheck     PROD
5 UK1010     Unix        Java       4.1       CustomerForm FillIt       PROD
6 UK1010     Unix        Java       5.0       Accounting   TaxMe        PROD

这可以实现吗?如果,那么应该如何解决这个问题呢? (对不起,如果这个问题很暗淡,我是使用python进行数据分析的新手)

0 个答案:

没有答案