如何使用机器学习从扫描的文档中提取指定的段

时间:2019-06-17 11:00:26

标签: python machine-learning deep-learning nlp

我正在使用Tensorflow对象检测API来训练图像。它成功地检测了标记的对象。 现在,我希望在文本提取中实现相同的概念。使用深度学习,如何从文档中提取信息。例如,从简历中提取经验部分。我可以创建经验数据集并进行培训。 1.我想知道如何使用这种训练有素的模型从简历中提取内容?

  1. 是否有任何方法可从扫描的文档中提取指定信息?
  2. 以及如何在这种方法中实现机器学习概念?

如果我的逻辑是错误的。请帮我弄清楚。

1 个答案:

答案 0 :(得分:0)

Kaggle是查看此类数据集的最佳场所。

检查this链接:

  

出版物包括《纽约时报》,布赖特巴特,CNN,《商业》杂志   内部人士,大西洋,福克斯新闻,谈话要点备忘录,Buzzfeed新闻,   国家评论,纽约邮报,卫报,NPR,路透社,Vox和   华盛顿邮报