我在用于搜索文档的列表中有一个关键字列表。
像这样['PO #','PO:','purchase order',....]
保存的关键字。
我用过fuzzyset
。最好只使用一个关键字,但是当存在多个关键字时,我想我必须遍历文档中的每一行,并将其与耗时的活动的单个关键字进行比较。
from fuzzyset import FuzzySet
with open('PO_Test.txt','r') as f:
corpus = f.readlines()
corpus = [line.lstrip() for line in corpus]
fs = FuzzySet(corpus)
query = "PURCHASE ORDER:"
print (fs.get(query))
从PO_Test.txt下载
我可以使用哪种替代解决方案来优化使用时间