python django分析文件以获取关键字列表

时间:2011-11-07 20:15:10

标签: python django

我有一个关键字列表,我需要确保它不存在于字符串中。 该字符串可以是纯文本或纯文本,其中包含svn或git存储库语法,例如补丁。 你究竟如何在python / django环境中实现这个搜索;正则表达式,循环,grep?理想情况下,我也希望得到它可以显示给用户的行。

2 个答案:

答案 0 :(得分:1)

txt = open('the_file.txt', 'r').read()
for keyword in ['foo', 'bar']:
    if keyword in txt:
        # Do something for when the keyword is found
        print 'Matched keyword %s' % keyword

答案 1 :(得分:1)

你在这里:

import re

BAD_WORDS = ["spam", "ham"]
BAD_WORDS_RE = re.compile(r"\b(%s)\b" % "|".join(BAD_WORDS))

for i, line in enumerate(open("file.txt").readlines()):
    words = set(BAD_WORDS_RE.findall(line))
    if words:
        print "Found the following words on line %i: %s" % (i + 1, ", ".join(words))
        print line