大家好我实际上有两个数据帧(爆炸输出),但其中一个信息比另一个更多,问题是在dataframe 2
中有更多信息,数据较少(因为缺少信息但是我实际上想保留first dataframe
中的这些行。
这是一个例子
假设第一个df是包含所有行的那个:
seq_id1 seq_id2 other columns
seq1_A seq2_B something
seq2_A seq3_B something
seq4_A seq9_B something
seq9_A seq9_B something
seq10_A seq8_B something
和另一个
seq_id1 seq_id2 other_columns aditionnal_info_columns
seq1_A seq2_B something kingdom1
seq4_A seq9_B something kingdom2
我想得到的是一个数据框:
seq_id1 seq_id2 other_columns aditionnal_info_columns
seq1_A seq2_B something Kingdom1
seq2_A seq3_B something NA
seq4_A seq9_B something Kingdom2
seq9_A seq9_B something NA
seq10_A seq8_B something NA
清楚吗? 谢谢你的帮助:)
我试过
Tax_id=pd.read_csv("0042_HYposoter_tax_best-hit.csv",header=0)
data_grpd_max.read_csv("data_grpd_max_tax_0035.txt",sep='\t')
data=pd.merge(data_grpd_max,Tax_id, how='left')
data.to_csv("data_grpd_max_tax_0042_new.txt",sep='\t')
但它不能像我想的那样工作