我在这里(代码部分)获得了一些很好的帮助,用于将单词doc转储到文本中。现在我 寻求帮助将PDF文档(* .pdf)转储到文本?我正在使用Delphi 2010.我更喜欢非组件,非Active-X解决方案......因为这段代码将被合并到我自己的组件中。
由于
答案 0 :(得分:4)
据我所知,你有两个免费选择。
首先,xpf包中有一个命令行工具,可以从http://www.foolabs.com/xpdf
免费获得然后,http://mupdf.com项目中的另一个命令行工具
两者都可以从Delphi轻松调用。我使用了xpdf的pdftotext.exe文件没有任何问题。
答案 1 :(得分:3)
PDFtext可以做到。不过,你需要支付57美元并部署额外的dll。
答案 2 :(得分:1)
我一直在使用QuickPDF库来查找PDF文件中的文本。我使用函数
GetPageText(ExtractOptions: Integer): string;
从每个页面获取文本,以便可以搜索它。 如果对ExtractOptions使用0,它将以可读格式返回文本。它不是免费的,但是库和文档都非常好。此外,他们的网站上还有一个非常活跃的社区博客。
答案 3 :(得分:0)
我没有尝试过,但是TSMPDFReader似乎适合您:没有DLL,没有Activex,没有外部组件。 不是免费的,但35欧元并不是太贵。
我正在使用Scalabium的其他组件:大力支持。