如何使用不同的csv文件覆盖csv文件中的列

时间:2013-12-10 22:29:10

标签: python csv join merge pandas

我是python的新手,我完全陷入困境!我有两个csv文件,我试图合并为一个csv文件。下面是每个文件的前几行,包括我想要获得的实际输出文件和输出文件。 注意:我意识到文件不完全匹配(即CO_Num不相同),但我只是抓住了每个文件的前几行,但它们没有按顺序排列。

plat1.csv: 
District,Complex_ID,Structure_Num,Area,Block,Name,Long,Latitude,Operator,Status,Comments,CO_Num
4,90100,1,AC, 24, SSMANIFO,  -94.76940277,  26.95505833,,,,     ,      
4,183,1,AC, 25,  A-Hoover Spar,  -94.68872137,  26.93905139,,,,00276, 4825   
4,2008,1,AC, 857, A(Perdido),  -94.89791489,  26.12890071,,,,00689, 7835  


COMPAC.csv:
CO_Num,Operator
03249, LOUISIANA LAND AND EXPLORATION COMPANY LLC     
03267,145 OG HOLDINGS LLC                             
03271,157 OG HOLDINGS LLC             

plat2.csv
 ,90222,1,WR, 469, SS Manifold,  -90.53058044,  26.51964805,,,,     ,      
4,183,1,AC, 25,  A-Hoover Spar,  -94.68872137,  26.93905139,,,,00276, 4825   
4,10500,1,GA, 209, A,    -94.545972,    29.130363,,,,00276,   58 

desired plat2.csv
District,Complex_ID,Structure_Num,Area,Block,Name,Long,Latitude,Operator,Status,Comments,CO_Num
4, 90100,1,AC,24, SSMANIFO,-94.76940277,26.95505833,,,,                                                                
4, 183,1,AC,25,A-Hoover Spar,-94.68872137,26.93905139,EXXON MOBIL CORPORATION,,,00276                    
4,2008,1,AC, 857, A(Perdido),-94.89791489,26.12890071,SHELL OFFSHORE INC.,,,00689

我需要根据CO_Num列加入文件。我遇到的问题是运营商专栏。在plat1.csv中,该列为空,我需要使用COMPAC.csv文件来填充它。我尝试使用下面的代码,但它不起作用。在plat2.csv中,Operator字段仍为空。

import pandas as pd

c=pd.read_csv("c:/platform/plat1.csv")

d=pd.read_csv("c:/platform/COMPAC.csv")

merged=c.merge(d, how='left')

merged.to_csv("c:/platform/plat2.csv", index=False)

我还应该提一下,并非plat1.csv中的每一行都有CO_Num。我认为这可能是问题的一部分,但是当我将plat1.csv和COMPAC.csv剪切到每行中的一行(显然匹配CO_Numb)后重新运行时,它仍然无效。

之后我尝试使用剪切的文件再次重新运行它,但我从plat1.csv中删除了Operator列。这是成功的,但我需要Operator列在plat1.csv中的位置,而不是在最后。

基本上,我需要一种方法来加入/合并这两个csv文件,其中plat1.csv中的Operator列被COMPAC.csv文件中的内容覆盖,如果没有CO_Num,那么该行只是空的“运算符”列(所有其他列保持不变)。

我再次对此非常陌生,或者如果某些事情没有意义,或者如果您有疑问,请告诉我们!

1 个答案:

答案 0 :(得分:0)

您不应在合并中包含c的空Operator列(包括它意味着在CO_Num和Operator上合并,这意味着没有共享密钥):

merged = c[col for col in c.columns if col != 'Operator'].merge(d, how='left')