从100个.htm文件中提取“http”字符串

时间:2012-08-27 13:11:28

标签: extract

我知道一点php,有点python,而且我非常精通寻找工具,但我找不到一个工具或方法来解析htm文件并返回包含“http”的所有字符串

我知道有快速解决方法。任何人吗?

1 个答案:

答案 0 :(得分:0)

你可以在python中试试这个:

def grepFileForLines(self, fileName = "", keepLinesWith = ""):
    fileObj = open(fileName, 'r')
    matches = []
    for line in fileObj:
        if line.find(keepLinesWith) > -1:
            matches.append(line)
    return matches