合并2个数据帧熊猫

时间:2018-05-16 20:09:40

标签: python pandas

大家好我实际上有两个数据帧(爆炸输出),但其中一个信息比另一个更多,问题是在dataframe 2中有更多信息,数据较少(因为缺少信息但是我实际上想保留first dataframe中的这些行。 这是一个例子

假设第一个df是包含所有行的那个:

seq_id1     seq_id2     other columns
seq1_A      seq2_B      something
seq2_A      seq3_B      something
seq4_A      seq9_B      something
seq9_A      seq9_B      something
seq10_A     seq8_B      something

和另一个

seq_id1     seq_id2     other_columns aditionnal_info_columns
seq1_A      seq2_B      something      kingdom1
seq4_A      seq9_B      something      kingdom2

我想得到的是一个数据框:

seq_id1     seq_id2     other_columns  aditionnal_info_columns
seq1_A      seq2_B      something       Kingdom1
seq2_A      seq3_B      something       NA
seq4_A      seq9_B      something       Kingdom2
seq9_A      seq9_B      something       NA
seq10_A     seq8_B      something       NA

清楚吗? 谢谢你的帮助:)

我试过

Tax_id=pd.read_csv("0042_HYposoter_tax_best-hit.csv",header=0)
data_grpd_max.read_csv("data_grpd_max_tax_0035.txt",sep='\t')

data=pd.merge(data_grpd_max,Tax_id, how='left')

data.to_csv("data_grpd_max_tax_0042_new.txt",sep='\t')

但它不能像我想的那样工作

0 个答案:

没有答案