如何阅读PDF文件

时间:2012-05-16 08:29:42

标签: pdf vb6

除了使用ADO之外,还有其他方法可以使用VB6从PDF文件中提取数据吗?我已成功设法使用VB6打开PDF文件而不使用Acrobat Reader,但我项目的下一步需要阅读PDF文件并从中查找数据。示例哪些页面显示“水泥”一词?

1 个答案:

答案 0 :(得分:1)

通常,您需要依赖外部库。一个纯粹的VB解决方案(即自己阅读文件和处理文件)在一周之内就不算什么了。

您可以通过自动化使用Adobe Acrobat。一个让你入门的例子是http://www.freevbcode.com/ShowCode.asp?ID=7066。但请注意,Adobe Reader还不够,您确实需要完整的Acrobat。还有其他流行的PDF阅读库(例如poppler),但是你可能很难在VB6中使用它们。

总的来说,你成功的机会取决于你所说的“摘录”。简单的说,  PDF是一种纯粹的描述性格式,没有元信息。即该文件包含诸如“把a放在(x1,y1);把'foo'放在(x2,y2)”等指令。阅读表或任何类型的结构化信息都需要大量的启发式。

最好的做法可能是尝试以更适合的数据格式(明文,XML等)提取您想要提取的数据。