应用错误收集

我在用于搜索文档的列表中有一个关键字列表。像这样['PO #','PO:','purchase order',....]保存的关键字。

我用过fuzzyset。最好只使用一个关键字，但是当存在多个关键字时，我想我必须遍历文档中的每一行，并将其与耗时的活动的单个关键字进行比较。

from fuzzyset import FuzzySet

with open('PO_Test.txt','r') as f:
    corpus = f.readlines()

    corpus = [line.lstrip() for line in corpus]
    fs = FuzzySet(corpus)
    query = "PURCHASE ORDER:"

    print (fs.get(query))

从PO_Test.txt下载

我可以使用哪种替代解决方案来优化使用时间

使用模糊字符串匹配器在文档中搜索多个关键字

0 个答案: