使用python失败在文件中搜索字符串

时间:2013-02-07 11:03:30

标签: python string file python-3.x

我正在使用此代码搜索特定文件中的电子邮件,并将其写入另一个文件。我使用'in'运算符来确保电子邮件不重复。 但是这段代码不会在for line in f:行之后执行。 任何人都可以指出我在这里犯的错误吗?

tempPath = input("Please Enter the Path of the File\n")
temp_file = open(tempPath, "r")
fileContent = temp_file.read()
temp_file.close()

pattern_normal = re.compile("[-a-zA-Z0-9._]+@[-a-zA-Z0-9_]+.[a-zA-Z0-9_.]+")

pattern_normal_list = pattern_normal.findall(str(fileContent))

with open('emails_file.txt', 'a+') as f:            
    for item in pattern_normal_list:            
        for line in f:
            if line in item:
                print("duplicate")
            else:
                print("%s" %item)
                f.write("%s" %item)
                f.write('\n')

2 个答案:

答案 0 :(得分:1)

新解决方案:

tempPath = input("Please Enter the Path of the File\n")
temp_file = open(tempPath, "r")
fileContent = temp_file.read()
temp_file.close()

pattern_normal = re.compile("[-a-zA-Z0-9._]+@[-a-zA-Z0-9_]+.[a-zA-Z0-9_.]+")

addresses = list(set(pattern_normal.findall(str(fileContent))))
with open('new_emails.txt', 'a+') as f:
    f.write('\n'.join(addresses))

我认为您的逻辑 错误,这有效:

addresses = ['test@wham.com', 'heffa@wham.com']

with open('emails_file.txt', 'a+') as f:
    fdata = f.read()
    for mail in addresses:
        if not mail in fdata:
            f.write(mail + '\n')

没有仔细阅读您的代码, 它看起来像是你逐行循环,检查你是否也在循环中存在的地址是否存在于行中,如果你没有附加你的电子邮件?但是在100行的99%中,地址不会出现在行中,因此您将获得不必要的添加。

我的代码段输出:

[Torxed@faparch ~]$ cat emails_file.txt 
test@wham.com
Torxed@whoever.com
[Torxed@faparch ~]$ python test.py 
[Torxed@faparch ~]$ cat emails_file.txt 
test@wham.com
Torxed@whoever.com
heffa@wham.com
[Torxed@faparch ~]$ 

答案 1 :(得分:-2)

for line in f:

你不应该先调用f.readlines()吗?

lines = f.readlines()
for line in lines:

检查一下。