我用Scrapy抓取了一个网站。之后,用户可以使用algolia在我的网站上搜索结果。我的问题是一般结果的抓取精度。 例如,当我刮擦包含“红木床”的物品时,我用“红木床”刮擦了所有物体,这很准确。 然后我寻找“红床”。问题是“红木床”的结果也被刮掉了,我不希望这样。我的刮板中有1万种不同的“搜索”。 如何在python中严格选择“红床”以使其尽可能准确?
我的第一个猜测是先刮掉所有内容,然后对结果进行排序:
for x in "red wood items":
if "bed" in "red wood bed":
remove "result containing bed"
但是似乎很长。 Python中还有另一种方法吗?