如何使用NLP和python从文档中提取特定内容,如名称或DOB?

时间:2016-06-22 11:52:43

标签: python machine-learning nlp

我想从文档中提取非常具体的内容,例如名称,地址和dob(例如简历)。假设我有1000个这样的文档,我想使用机器学习和自然语言处理来自动化它。最好是python 我怎样才能做到这一点?或者我从哪里开始?

更新:我知道NER,但我希望从文档中提取非常具体的信息,这些信息可以加载到Excel中。

示例:从项目报告中,我想提取项目的主题,团队成员名称和任期。

1 个答案:

答案 0 :(得分:0)

我认为您正在寻找的是NLP中称为命名实体识别(NER)的内容。

实际上,一个实体可以是一个人名,一个地名,一个名字等等。

您可以查看此stackOverFlow answer以获取更多信息。