基于CSV文件的搜索引擎

时间:2017-07-18 09:13:35

标签: machine-learning nlp

我是NLP的新手,最近我正在做选择用户信息需求的价格比较工具,该工具背后的整个过程是先查找需要的信息的产品类别,然后获得此类别下最相似的产品。我的数据集是干净的,有条理的,存储在CSV文件中,其属性包括" id","零售商","产品类别","产品名称&#34 ;,"价格单位""价格""量" 在我的产品类别列表中,某些产品类别已经包含了产品的关键词(" ASDA选择了Kids Cute和Juicy Apples"在"苹果,梨子rhunarb")。  但也有一些例外,比如"选择柠檬"和#34;选择石灰"属于"柑橘类水果"类

所以我需要首先匹配输入查询(按用户输入产品名称)和产品类别,但是如何识别用户给出的输入产品的分类/产品类别现在对我来说不确定,我得到的建议就像使用倒置指数。 任何人都可以给我更多关于这个问题的建议。 感谢

1 个答案:

答案 0 :(得分:0)

您正在寻找的是项目推荐。看看item-item collaborative filtering。由于您有与每个项目关联的关键字。你也可以类似地潜入cosin。您可能也对graph based recommender engine techniques

感兴趣