比较两个.txt文件中的行,打印出未包含单词的换行符

时间:2015-08-12 10:06:56

标签: python python-2.7

我有以下代码,对于textfile1中的每一行,搜索textfile2,如果该行包含在textfile2中,则打印出相应的textfile2行。但是,我想为textfile2中未包含的每一行打印出新行。这是代码:

def readline():
with open("textfile1.txt") as file, open("textfile2.txt") as file2:
    string = set(map(str.rstrip,file))
    for line in file2:
        spl = line.split(None, 1)[0]
        if spl in string:
            print(line.rstrip())    
        else:              ##if spl not in string print new line
            print("\n")

它无法正常工作(不打印任何新行),可能是什么问题或任何替代解决方案?

示例Textfile1:

'
a
aa
ab
abandon
abandonaudiofocus
abandonsession
abort
abortablehttprequest
abortanimation
abortcaptures
abortconnection
abortpolicy
abortrequest
abs

示例Textfile2:

'                |            22624
a                |               91
aa               |                7
ab               |                6
abort            |                8
abortanimation   |                5
abs              |              131
abslistview      |              115
absolutelayout   |               50
absolutesizespan |                6
abstracthttpentity |                2
abstractlist     |                1
abstractmap      |                4
abstractselector |                1
abstractset      |                2

Textfile1包含更多单词,它包含textfile2中的所有单词。

3 个答案:

答案 0 :(得分:1)

对于textfile2中的每一行,在textfile1中搜索其中的第一部分,如果该行包含在textfile2中,则会打印出相应的textfile2行。

def readline():
        file1_list = [line.rstrip() for line in open("textfile1.txt")]
        file2_list = [line.rstrip() for line in open("textfile2.txt")]
        fileo_list = [line if line.split(None, 1)[0] in file1_list else '' for line in file2_list]
        for line in fileo_list:
            print(line)

这将打印出来:

'                |            22624
a                |               91
aa               |                7
ab               |                6
abort            |                8
abortanimation   |                5
abs              |              131


.....

答案 1 :(得分:0)

根据你的问题 -

  

对于textfile1中的每一行,搜索textfile2,如果该行包含在textfile2中,则打印出相应的textfile2行

评论 -

  

Textfile1包含更多单词,它包含textfile2中的所有单词

如果实际相反,你现在拥有的逻辑,它检查file2中的每一行 - textfile2.txt - 该行的第一部分是否存在于file - textfile1.txt - 根据你的评论,这总是正确的。

您需要获取集合中file2的所有元素(每行的第一部分),然后检查file的每一行。示例 -

def get_first(line):
    return line.split(None, 1)[0]

def readline():
    with open("textfile1.txt",'r') as file, open("textfile2.txt",'r') as file2:
        string = set(map(get_first,file2))
        file2.seek(0)
        file2_dict = {}
        for line in file2:
            file2_dict[line.split(None, 1)[0]] = line
        for line in file:
            if line.strip() in string:
                print(file2_dict[line.rstrip()])    
            else:              ##if spl not in string print new line
                print()

此外,您在其他部分的"\n"内不需要print(),print也会自行添加换行符,您可以这样做 - print()来打印换行符。

示例/演示 -

>>> def get_first(line):
...     return line.split(None, 1)[0]
...
>>> def readline():
...     with open("a.txt",'r') as file, open("b.txt",'r') as file2:
...         string = set(map(get_first,file2))
...         for line in file:
...             if line.strip() in string:
...                 print(line.rstrip())
...             else:              ##if spl not in string print new line
...                 print()
...
>>> readline()
a
aa
ab



abort

abortanimation




abs

在上面的示例中,a.txt包含示例textfile1.txt中的数据,而b.txt包含来自textfile2.txt示例的数据。

答案 2 :(得分:0)

Sets让这很简单

with open("textfile1.txt") as file1:
    textfile_1_set = set(map(str.rstrip, file1))

with open("textfile2.txt") as file2:
    textfile_2_set = set([l.split()[0] for l in file2])

# remove all the lines that are in textfile2 from the 
# set of lines from textfile1
in_1_but_not_2 = textfile_1_set - textfile_2_set

for line in in_1_but_not_2:
    print line