Python IO匹配来自不同文件的字符串

时间:2014-08-14 17:00:36

标签: python dictionary io text-files counting

这里有一个蟒蛇新手,所以有人可以告诉我这里我做错了什么吗?

编辑: 问题是: 意外输出......某些行的频率超过100,而路径中只有10个文件,每个文件只有唯一的行。

这是基本算法:

  • 阅读REF文件
  • 对于路径中的每个文件(x),请执行以下操作:
  • 将x中的每一行与REF中的每一行进行比较,然后:
  • 如果两条线匹配,则将线数(频率)增加1.
  • 如果此行在REF中不存在,则将此行添加到输出并将频率设置为0.

    import os
    from itertools import izip
    
    path = "./logs"
    
    rankdict = {}
    with open('REF.out', 'r') as f:
            for line in f:
                    rankdict[line.strip()]= int(0)
    
    for d in os.listdir(path):
            pd = os.path.join(path, d)
            with open(pd, 'r') as currentFile:
                    for line in izip(currentFile):
                            linex = str(line).strip()
                            if linex not in rankdict:
                                    rankdict.update({linex: int(0)})
                            else:
                                    rankdict[linex] +=1
    

0 个答案:

没有答案