标签: python machine-learning nlp
我想从文档中提取非常具体的内容,例如名称,地址和dob(例如简历)。假设我有1000个这样的文档,我想使用机器学习和自然语言处理来自动化它。最好是python 我怎样才能做到这一点?或者我从哪里开始?
更新:我知道NER,但我希望从文档中提取非常具体的信息,这些信息可以加载到Excel中。
示例:从项目报告中,我想提取项目的主题,团队成员名称和任期。
答案 0 :(得分:0)
我认为您正在寻找的是NLP中称为命名实体识别(NER)的内容。
实际上,一个实体可以是一个人名,一个地名,一个名字等等。
您可以查看此stackOverFlow answer以获取更多信息。