标签: python pdf nlp
我正在尝试从各公司的年度报告中自动化数据提取(例如工厂数量,员工数量等),并填写excel表中相关领域的数据。
截至目前,我已经考虑过在Python中使用以下过程:
问题是数据非常非结构化,年度报告格式因公司而异。 任何人都可以建议一种更好的方法来自动完成这项任务吗?