我的程序的目标是创建一个项(键)及其数量(值)的字典。密钥是从一个文本文件中提取的,在该文本文件中它们被组织为列表。
示例:['synonymous_variant'] ['splice_region_variant&synonymous_variant'['synonymous_variant'](每个列表都换行,没有任何分隔符)
代码:
from collections import Counter
file = open('/home/becquart/Stagiaire_refinement_construct_peptides/Travail5/RE__[Allogenomics]_travail_Vcf/results.txt', 'r').read()
for char in '""-.,\n[]':
file = file.replace(char,' ')
for i in char:
file = file.replace('""', ' ')
file = file.lower()
word_list = file.split()
d = dict(Counter(word_list).most_common())
print d
输出类似于:{"'coding_sequence_variant&3_prime_utr_variant'": 6, "'inframe_insertion&nmd_transcript_variant'": 17
等。
我想从键中删除"
,但是我很难弄清楚它的含义,因为我在编程方面很新...如果能解决这个问题,我将非常高兴。
提前谢谢!
修改: 在此处输入文件:https://ufile.io/v1tm0