我有一个关键字列表,我需要确保它不存在于字符串中。 该字符串可以是纯文本或纯文本,其中包含svn或git存储库语法,例如补丁。 你究竟如何在python / django环境中实现这个搜索;正则表达式,循环,grep?理想情况下,我也希望得到它可以显示给用户的行。
答案 0 :(得分:1)
txt = open('the_file.txt', 'r').read()
for keyword in ['foo', 'bar']:
if keyword in txt:
# Do something for when the keyword is found
print 'Matched keyword %s' % keyword
答案 1 :(得分:1)
你在这里:
import re
BAD_WORDS = ["spam", "ham"]
BAD_WORDS_RE = re.compile(r"\b(%s)\b" % "|".join(BAD_WORDS))
for i, line in enumerate(open("file.txt").readlines()):
words = set(BAD_WORDS_RE.findall(line))
if words:
print "Found the following words on line %i: %s" % (i + 1, ", ".join(words))
print line