每个id连接,合并或连接多个Dask DataFrame,并具有不同的行和列数

时间:2019-11-08 14:35:03

标签: python pandas dataframe concatenation dask

我正在尝试联接,合并或连接多个dask数据帧,但我不知道如何正确地按id进行操作。

DataFrame#1 (9行x 3列)

index   id    name         last_name          
0       0001  Gilberth     Nutra         
1       0001  Gilberth     Nutra          
2       0001  Gilberth     Nutra      
3       0002  Jhon Jaime   Nutra 
4       0002  Jhon Jaime   Nutra
5       0002  Jhon Jaime   Nutra
6       0003  Francisco    Nutra
7       0003  Francisco    Nutra 
8       0003  Francisco    Nutra  

DataFrame#2 (3行x 4列)

index   id       country   department       city
0       0001     Colombia  Choco            Quibdo
1       0002     Colombia  Antioquia        Medellin
2       0003     Colombia  Atlantico        Barranquilla

我需要一个这样的数据框:

加入/合并/连接DataFrame (9行x 6列)

index   id    name         last_name   country    department        city          
0       0001  Gilberth     Nutra       Colombia   Choco             Quibdo
1       0001  Gilberth     Nutra       Colombia   Choco             Quibdo
2       0001  Gilberth     Nutra       Colombia   Choco             Quibdo
3       0002  Jhon Jaime   Nutra       Colombia   Antioquia         Medellin   
4       0002  Jhon Jaime   Nutra       Colombia   Antioquia         Medellin
5       0002  Jhon Jaime   Nutra       Colombia   Antioquia         Medellin
6       0003  Francisco    Nutra       Colombia   Atlantico         Barraquilla
7       0003  Francisco    Nutra       Colombia   Atlantico         Barraquilla
8       0003  Francisco    Nutra       Colombia   Atlantico         Barraquilla

谢谢。

0 个答案:

没有答案