我正在开展一个项目,有许多零售商独立上传他们的产品信息,换句话说,完全相同的产品可能有不同的名称。例如,新的ipad,或ipad或Great ipad等...
我想向用户呈现一个直观的界面,这样当他搜索ipad或ipads时,他会将所有价格并列的ipad作为搜索结果。或者可能是2个搜索结果,第一个是旧的ipad,其中包含来自不同零售商的所有价格,另一个是ipad 2的搜索结果,另外还有一个旁边的价格。
具体例子: 数据库包含:新的ipad 1,ipad 1,伟大的ipad 1,新的ipad 2,ipad 2,伟大的ipad 2 当用户搜索ipad时,他得到:
这主要是搜索特定的问题吗?还是机器学习,自动标记?
有没有人知道像Rails3中那样实现的东西?
由于
答案 0 :(得分:1)
重复删除问题。地图,目录正在处理它。这个问题有很多解决方案,成功程度不同。 最简单的一个是识别同义词和无用的单词(伟大,有趣)等,并使用此信息进行匹配项目。一些不明确的案例你应该发送给人进行审查。
示例“new Apple Ipad”vs“Great ipad”= remove usless word => “Apple ipad”vs“ipad”=等于substring / to ambiguous =>等于