使用模糊字符串匹配器在文档中搜索多个关键字

时间:2018-07-17 08:40:30

标签: python fuzzy-search fuzzy-comparison

我在用于搜索文档的列表中有一个关键字列表。 像这样['PO #','PO:','purchase order',....]保存的关键字。

我用过fuzzyset。最好只使用一个关键字,但是当存在多个关键字时,我想我必须遍历文档中的每一行,并将其与耗时的活动的单个关键字进行比较。

from fuzzyset import FuzzySet

with open('PO_Test.txt','r') as f:
    corpus = f.readlines()

    corpus = [line.lstrip() for line in corpus]
    fs = FuzzySet(corpus)
    query = "PURCHASE ORDER:"

    print (fs.get(query))

PO_Test.txt下载

我可以使用哪种替代解决方案来优化使用时间

0 个答案:

没有答案