这里有一个蟒蛇新手,所以有人可以告诉我这里我做错了什么吗?
编辑: 问题是: 意外输出......某些行的频率超过100,而路径中只有10个文件,每个文件只有唯一的行。
这是基本算法:
如果此行在REF中不存在,则将此行添加到输出并将频率设置为0.
import os
from itertools import izip
path = "./logs"
rankdict = {}
with open('REF.out', 'r') as f:
for line in f:
rankdict[line.strip()]= int(0)
for d in os.listdir(path):
pd = os.path.join(path, d)
with open(pd, 'r') as currentFile:
for line in izip(currentFile):
linex = str(line).strip()
if linex not in rankdict:
rankdict.update({linex: int(0)})
else:
rankdict[linex] +=1