使用自然语言处理从段落中提取特定类型的单词

时间:2019-05-16 05:21:34

标签: python-3.x machine-learning spacy data-processing natural-language-processing

我正在开发提取特定类型单词的模型。考虑我的数据集如下:

  1. I want to book movie tickets for 2 peoples.
  2. I need to book movie tickets for 2 seats.
  3. I required two seat for movie

从上面的三个语句中,我想提取数字2,它可能是整数或字符串,或者是指座位或人。

我尝试了命名实体识别,但是没有得到所需的输出。对于另一个输出,我使用了情感分析。但是问题是要提取人数。

我希望段落中的人数可以是整数或字符串。感谢您的帮助。

1 个答案:

答案 0 :(得分:0)

import spacy
nlp = spacy.load('en')   
doc = nlp("I want to book movie tickets for 2 peoples. I need to book movie tickets
           for 2 seats. I required two seat for movie.")
for i in doc.ents:
if i.label_ == 'CARDINAL':
    print(i.text, i.label_)

输出:-

2 CARDINAL
2 CARDINAL
two CARDINAL