这是哪种NLP?

时间:2019-07-05 05:40:43

标签: python machine-learning nlp

我知道NLP分类是当我们将整个文本分类为(健康,体育,社会,商业等)时

  

(伦敦)-拉斐尔·纳达尔(Rafael Nadal)对全英格兰提出了尖锐的批评   俱乐部在比赛开始前两天的星期六的独特播种规则   温布尔登。

     

“我尊重温网规则,”纳达尔对记者说:“ ...如果我   信不信由你,这是另一回事。我真的个人   相信[它]不是。”

     

温布尔登使用特殊公式为   锦标赛,有时会偏离标准ATP排名。的   公式可进一步提高球员在草地球场上的ATP记录,   提高或处罚少打球或少打球的球员   在草地上取得成功。

     

今年,温网排名将纳达尔降至   比赛的三号种子,罗杰·费德勒(Roger Federer)跳到他的上方。那   要求纳达尔击败种子上方的两名球员才能赢得比赛   标题。它还设置了与尼克·吉尔吉斯(Nik Kyrgios)进行比赛的可能性   在第二轮。

     

Kyrgios之前在本届比赛中击败了Nadal。

     

“系统就是这样,”费德勒在自己的媒体上说   会议。 “最终,如果您想赢得比赛,   您必须遍历眼前的所有玩家。”

     

版权所有©2019,ABC Radio。保留所有权利。

这将被视为“体育”文字

但这不是我想要的

我要识别文字中的一个或多个单词

就像上面的文字一样,如果我想识别玩家

  

(伦敦)- 拉斐尔·纳达尔 提出了对全英格兰的尖锐批评   俱乐部在比赛开始前两天的星期六的独特播种规则   温布尔登。

     

“我尊重温网规则,” 纳达尔 对记者说:“ ...如果我   信不信由你,这是另一回事。我真的个人   相信[它]不是。”

     

温布尔登使用特殊公式为   锦标赛,有时会偏离标准ATP排名。的   公式可进一步提高球员在草地球场上的ATP记录,   提高或处罚少打球或少打球的球员   在草地上取得成功。

     

今年,温网排名将 Nadal 降到了   比赛的三号种子, 罗杰·费德勒 跳到了他的上方。那   将需要 Nadal 击败种子上方的两名玩家才能赢得   标题。它还设置了与 Nik Kyrgios 进行比赛的可能性   在第二轮。

     

吉尔吉斯 之前在本届比赛中击败了 Nadal

     

“系统就是这样,” Federer 在他自己的媒体上说   会议。 “最终,如果您想赢得比赛,   您必须遍历眼前的所有玩家。”

     

版权所有©2019,ABC Radio。保留所有权利。

此方法称为什么,是否为此指定了任何python库?

3 个答案:

答案 0 :(得分:1)

您想识别姓名,此文本中的人物吗?这称为NER-命名实体重新识别。

如果要分析著名的nltk库,可以使用它:https://www.nltk.org/book/ch07.html

NLTK Named Entity recognition to a Python list

https://www.nltk.org/

答案 1 :(得分:1)

这属于命名实体识别(NER)的类别。您可以为此使用NLTK和spacy。 RASA NLU之类的工具还使您可以训练模型来识别这些实体。

以下是一些可能有用的链接:
https://towardsdatascience.com/named-entity-recognition-with-nltk-and-spacy-8c4a7d88e7da
https://rasa.com/docs/rasa/nlu/entity-extractio

答案 2 :(得分:1)

这是一个命名实体提取问题。您可以将NLTK,Spacy,Stanford核心NLP库用于命名实体识别。