您好我是python的新手并且因为询问可能很愚蠢的事情而道歉。非常感谢任何正确方向的参考。
我有一个字符串列表(3500个基因名称)
我有一张包含35000个基因的表格以及这些基因的几个特征。 IE浏览器。 Gene_ID Gene_Name chr_loc FPKM1 FPKM2 LFC ...... etc
我想找到我的清单中的基因,并提取出与这些基因相关的两个值,并将这三个东西放在一个新表中的所有3500个基因中。
我真的很感激任何帮助!
答案 0 :(得分:1)
假设标题在文件中,这是基本的想法:
import csv
namelist = ['name1', 'name2']
fout = open('out.csv','w')
fout.write('header1,header2,header3')
fin = open('temp.csv','r')
reader = csv.DictReader(fin)
for row in reader:
if row['header1'] in namelist:
fout.write(newrow(row))
您当然需要编写newrow
函数并调整输入文件格式的详细信息。