标签: python algorithm web-crawler scrapy-spider flask-restful
我正在尝试构建一个可以比较特定网站价格的restful api。 我开始废弃产品名称,价格和产品图片网址并将其保存到csv文件中。此时我有网站的A产品和网站B的产品。 但是,无法知道两个文件中的特定产品是否相同才能实际比较价格。我的方法是使用名为fuzzywuzzy的字符串匹配库,它工作正常。 在这种情况下,我觉得这样做是不切实际的,因为价格会不断变化,产品可能会被删除。
解决这个问题会有什么更好的解决方案?