我正在开发一个小型价格/产品比较网站,这是一个与笔记本电脑和平板电脑相关的利基网站,内置于php。
我的问题/问题是如何执行以下操作:“匹配来自不同商家的类似产品”。我的意思是,当产品具有EAN / ISBN时,可以使用简单的%LIKE%。但是我得到的数据馈送有很多产品缺少ean或任何其他唯一ID。价格比较网站如何处理这个?
我正在考虑搜索产品名称之间的字符串相似性,但我不想匹配: Acer iconia tab a500
和 acer iconia tab a500 case 作为同类产品。任何想法?
谢谢!
答案 0 :(得分:1)
要实现比较,您必须为产品添加一些标签。当某人搜索产品时,列出具有相同标签的其他产品。
例如:对于笔记本电脑标签,如笔记本电脑,宏基,14“,500美元(价格)等。
所以当有人搜索笔记本电脑时,请列出所有笔记本电脑。这样他就可以选择2个。并进行比较。
希望你有这个概念。
答案 1 :(得分:0)
我遇到了类似的问题。有不同的解决方案。
您可以使用某些搜索技术找到类似项目(全文搜索引擎可能会有所帮助)或使用一些数据挖掘方法(查看命名实体识别以识别品牌,型号,颜色......等等。文本挖掘的学习方法)。如果做得好,后者可以更准确。
在这两种方法中,您可以使用一些额外的模糊逻辑对可以用不同方式编写的单词进行字符串比较。以及消除错误项目的一般预定义规则。例如,考虑到价格可以区分物品及其配件,尽管它们具有非常相似的标题。