提取产品描述文本的产品模型(不是评论,非结构化文本)

时间:2016-03-30 10:58:45

标签: python machine-learning nlp named-entity-recognition

我正在寻找一种方法来帮助我完成这项任务。我熟悉NER,但在这种情况下它不会帮助我,句子很短,NER不能很好地用它。

输入是产品描述(例如,来自亚马逊,请参见下图中标记的行),而不是POS标记可能有用的内容。

enter image description here

一个例子:

1. Apple iPhone 6 64GB White
2. iRobot Scooba 390 Floor Scrubbing Robot
3. Samsung UN60J6200 60-Inch TV with HW-J450 Soundbar

我正在寻找的结果:

1. Brand: Apple, Model: iPhone 6, Features: 64GB, White
2. Brand: iRobot, Model: Scooba 390, Features: Floor Scrubbing Robot
3. Brand: Samsung , Model: UN60J6200 , Features: 60-Inch, HW-J450 Soundbar

这对我来说是一个非常棘手的问题,直到现在,我已经以非通用的方式解决了这个问题,只是使用了NLP方法。所以我想知道是否有一种培训模型的方法。

我想补充一些要点:

  • 品牌名称并不总是在句子的开头
  • 有时整个句子只包含小写字母。
  • 在许多情况下,不同品牌的产品使用非常相似的型号(例如iPhone 6s和Galaxy S6)。

0 个答案:

没有答案