如何在python中的docx中找到两个标题之间的文本

时间:2019-05-08 10:59:06

标签: python-3.x deep-learning nlp spacy

我想从简历中提取信息,为此,我必须确定标题,并在标题下方获取文本数据。

1 个答案:

答案 0 :(得分:1)

我认为您需要针对您要采取的问题和方法进行更具体的说明。到目前为止,对于标题提取,您可以在阅读漂亮的汤后定义所有标题中的第一个主体。一旦创建了这样的语料库,您现在就可以将语料库与简历的标题进行匹配,并通过定义起点和终点数据点来获取该部分。然后匹配技能等无论您想做什么。 根据您当前的问题,这是最简单的方法。具体来说,我可以采用更精确的方法进行指导。

最好