通过PHP解析PDF / DOC银行对帐单

时间:2011-03-02 07:06:48

标签: php parsing pdf doc

我正在制定会计申请。用户将在应用程序中上传所需的pdf或doc银行对帐单。我需要读取/解析文档并在数据库中插入金额/支票号等...(根据我的数据库结构)。

请帮助实现同样的目标。

2 个答案:

答案 0 :(得分:0)

PDF用于表示,而不是用于处理内部数据。

pdftotextcatdoc可能会很幸运。

答案 1 :(得分:0)

我已经在同一个问题上工作了两个多星期了,我不得不说这是一个非常重要的任务。我已经成功找到了一个php类来提取文本,但问题是它不会对每个版本的.pdf格式起作用。并且自己敲击一段时间会花费一些时间来计算编码和压缩问题。现在我实际上在看一些python库。现在,从头开始编写其中一个,这对我来说太费时间了。