我正在制定会计申请。用户将在应用程序中上传所需的pdf或doc银行对帐单。我需要读取/解析文档并在数据库中插入金额/支票号等...(根据我的数据库结构)。
请帮助实现同样的目标。
答案 0 :(得分:0)
PDF用于表示,而不是用于处理内部数据。
pdftotext
或catdoc
可能会很幸运。
答案 1 :(得分:0)
我已经在同一个问题上工作了两个多星期了,我不得不说这是一个非常重要的任务。我已经成功找到了一个php类来提取文本,但问题是它不会对每个版本的.pdf格式起作用。并且自己敲击一段时间会花费一些时间来计算编码和压缩问题。现在我实际上在看一些python库。现在,从头开始编写其中一个,这对我来说太费时间了。