我不太清楚如何制定这个问题,欢迎提出改进标题的建议。
我有三个文件: e_data.csv , t_data.csv 和 e2d.csv 。我想将e_id
,t_id
,gene_name
和value
合并到一个文件中,如 desired_result.csv 所示。天真的方法如下:
e_id
和value
。t_id
与给定的e_id
对应。gene_name
对应于给定的t_id
。请参阅以下示例,了解我正在努力实现的目标:
e_data.csv:
e_id value
1 110
2 240
3 370
e2t.csv:
e_id t_id
1 10
2 24
3 32
t_data.csv:
t_id gene_name
10 Gene1
24 Gene2
32 Gene3
desired_result.csv:
gene_name t_id e_id value
Gene1 10 1 110
Gene2 24 2 240
Gene3 32 3 370
使用哪种工具或语言没有限制,但我更喜欢使用Python,因为这是我最熟悉的。 R也可以是一种选择。我已经用纯Python实现了一个解决方案,但数据集相当大,我希望像Pandas或Numpy这样的东西可以加快速度。谢谢!