将PDF文档(* .pdf)转储到文本?

时间:2010-11-27 13:28:08

标签: delphi pdf delphi-2010

我在这里(代码部分)获得了一些很好的帮助,用于将单词doc转储到文本中。现在我 寻求帮助将PDF文档(* .pdf)转储到文本?我正在使用Delphi 2010.我更喜欢非组件,非Active-X解决方案......因为这段代码将被合并到我自己的组件中。

由于

4 个答案:

答案 0 :(得分:4)

据我所知,你有两个免费选择。

首先,xpf包中有一个命令行工具,可以从http://www.foolabs.com/xpdf

免费获得

然后,http://mupdf.com项目中的另一个命令行工具

两者都可以从Delphi轻松调用。我使用了xpdf的pdftotext.exe文件没有任何问题。

答案 1 :(得分:3)

PDFtext可以做到。不过,你需要支付57美元并部署额外的dll。

答案 2 :(得分:1)

我一直在使用QuickPDF库来查找PDF文件中的文本。我使用函数

GetPageText(ExtractOptions: Integer): string;

从每个页面获取文本,以便可以搜索它。 如果对ExtractOptions使用0,它将以可读格式返回文本。它不是免费的,但是库和文档都非常好。此外,他们的网站上还有一个非常活跃的社区博客。

答案 3 :(得分:0)

我没有尝试过,但是TSMPDFReader似乎适合您:没有DLL,没有Activex,没有外部组件。 不是免费的,但35欧元并不是太贵。

我正在使用Scalabium的其他组件:大力支持。