从文本中提取产品属性/功能

时间:2016-03-16 05:31:39

标签: nlp feature-extraction named-entity-recognition named-entity-extraction

我已经分配了一项从产品说明中提取功能/属性的任务。

ct.setInt(1, id);

我需要能够提取诸如" Jeans"等属性。和#34;苗条健康"或者"购物袋"和"粉红色"和"黄金"。 产品描述清单不仅适用于衣服,它们基本上可以是任何东西。

我不知道如何解决这个问题。我尝试实现命名实体识别器解决方案以及POS实现,NER实现无法识别任何令牌,并且大多数令牌在POS解决方案中显示为NNP(专有名词),这对我没有帮助许多。我需要一种方法来区分产品的品牌名称和功能(如果它是T恤,颜色或设计(圆领,V领)等)。

我确实实现了一个KMean解决方案,该解决方案将产品集群在一起,但这又不是我想要的结果。

只是想找个人指引我走向正确的方向。

2 个答案:

答案 0 :(得分:0)

您可以利用基于方面的情感分析(ABSA)的最新进展。此领域中有一个分支可以提取方面和意见方面的内容。方面就像属性(实体/产品/服务的功能)。意见就是该属性的价值。例如,在这句话中:“这家餐厅提供美味的食物,并且员工友善” ,其中有两个方面/观点对:{(“ Food”,“ Good”),(“ Staff” ,“友好”)}

ABSA通常在用户评论中使用,但谁知道呢?它在这里也可以正常工作。您唯一需要了解的是,ABSA中的所有解决方案都是特定于领域的,这意味着您将针对一个特定领域(在您的情况下为“服装”)训练模型。推广到多领域已显示出较差的结果,仍然是一个积极研究的问题。

我希望对您有帮助

答案 1 :(得分:0)

有一些关于此主题的论文,例如OpenTag将其视为序列标记问题。