在网页中搜索字符串并使用python打印包含它的整行

时间:2015-11-20 08:04:32

标签: python search

我想在网页上搜索字符串并打印包含该字符串的整行。

我有一个输入文件,其中包含我想要搜索该字符串的链接。

要搜索的字符串:" vcore"

我的输入文件:

http://abc/cluster/app/application_1447334090028_225490
http://abc/cluster/app/application_1447334090028_228858

预期输出文件:

http://abc/cluster/app/application_1447334090028_225490    12434 vcore, 123 mb
http://abc/cluster/app/application_1447334090028_228858    12132 vcore, 131 mb
到目前为止

代码

import sys
import re
import urllib

Links = [Link.strip() for Link in open ('/home/try/Input.txt','r').readlines()]

for link in Links:
        webPage = urllib.urlopen(link).read()
        print webPage

然后我使用grep搜索字符串并将其存储在另一个文件中。但我希望它由代码本身和相应链接旁边的行显示。任何人都可以帮我吗?

2 个答案:

答案 0 :(得分:5)

lines = urllib.urlopen(link).readlines()
for line in lines:
    if "vcore" in line:
        print line

答案 1 :(得分:0)

import re
import urllib

Links = [Link.strip() for Link in open ('/home/try/Urls.txt','r').readlines()]

for link in Links:
        lines = urllib.urlopen(link).readlines()
        for line in lines:
                if "vcore" in line:
                        print link,line

每个打印声明后都有空行