我是python的新手,目前正在寻找一种方法来计算多个CSV文件中的关键字。这些文件具有如下通用结构:
PDB ID NDB ID Structure Title Citation Title Abstract
1ARJ 1ARJ ARG-bound TAR Structure of Solution structure of Arginine
RNA some complex RNA RNA complex.
我想获得一些指导,介绍如何编写导入多个csv文件的代码或循环这些文件的输入,然后返回关键字在记录中出现的次数以及包含命中的字段的值。我看过csv导入模块的一些教程,但我不知道如何使用它。
import csv
my_list = mRNA
words = {}
for items in my_list:
for item in items.split(', '):
words.setdefault(item, 0)
words[item] += 1
with open('mrna.csv', 'w') as fopen:
writer = csv.writer(fopen)
for word, count in words.items():
writer.writerow([word, count])