搜索文本中的关键短语

时间:2016-04-19 11:03:41

标签: python nlp

我正在寻找一种快速的解决方案,它允许我在(不大)文本中找到预定义的短语(1-5个单词)。

这些短语最多可以达到1000.假设简单的find()函数不是一个好的解决方案。

你能告诉我应该用什么吗? 提前致谢。

更新 为什么我不想使用布鲁特力搜索:

  • 我相信,它还不够快。
  • 文字可以在短语中包含一些内容。即短语可以是美国银行,但文本有美国银行。
  • 短语可能会有所改变 - 撇号,-s结束等。

1 个答案:

答案 0 :(得分:1)

我不确定您的目标,但您可以轻松地在文本中找到预定义的预言:

predefined_phrases = ["hello", "unicorns with a big mouth!", "Sweet donats"]
isnt_big_text = "A big mouse fly by unicorns with a big mouth! with hello wold."

for phrase in predefined_phrases:
    if phrase in isnt_big_text:
        print("Phrase '%s' found in text" % phrase)