NLP:从PDF文件提取特定于域的数据

时间:2019-01-21 10:25:04

标签: machine-learning deep-learning nlp stanford-nlp

NLP问题: 我有pdf文件,其中包含一些需要提取的重要信息。其中一些在键值对中。 。例如,pdf文件包含以下信息。

  • 姓名:John Wick先生
  • 购买的玩具:枪
  • 价格:£2,000

  • 日期:XYZ

但是,并非所有文档都具有相同的键,例如在某些文档中可能是相同的

  • 物品价格:£4,000
  • 当前日期或购买日期:ABC
  • 购买的玩具等。

提取此数据的最佳方法是什么?

0 个答案:

没有答案