我有两个长度不等的数据帧。根据分析,df1是重要基因,大约len = 200。看起来像这样:
Gene_Name P.Value
gene1 1E-15
gene17 1E-14
gene400 5E-14
etc
df2是我研究的物种中所有已知基因的列表,它们与 Arabidopsis ,len >>>> 200中最接近的同源物。看起来像这样:
Gene_Name Homolog_Name
gene1 Arabid_g1
gene2 Arabid_g2
gene3 Arabid_g3
etc
我想从df2的“ Homolog_Name”列中向df1添加一列,但仅针对df1中的200个基因,结果如下:
Gene_Name P.Value Homolog_Name
gene1 1E-15 Arabid_g1
gene17 1E-14 Arabid_g17
gene400 5E-14 Arabid_g400
etc
我不确定当df长度不同时该怎么做,有人建议吗?