PHP pdf 2文本问题

时间:2011-03-31 06:49:40

标签: php zend-framework pdf zend-pdf

我正在使用Zend_Pdf库从pdf中提取文本,我遇到了一些问题......

<?php
set_include_path (__DIR__ . '\data'); 
require_once 'Zend/Pdf.php'; 

 // Load PDF document from a file. 
$fileName = 'carbsarticle.pdf'; 
$pdf = new Zend_Pdf($fileName); 
$pdf = Zend_Pdf::parse($pdf); 
var_dump($pdf);

致命错误:未捕获的异常'Zend_Pdf_Exception',消息'文件不是PDF。'

我尝试下载其他pdf文件,但错误是一样的..

修改

try {
    $pdf2 = Zend_Pdf::load('test.pdf');
} catch (Exception $e)
{
    echo $e->getMessage();
}

回音:不支持加密文档修改

我的pdf:http://x3k.ru/test.pdf

4 个答案:

答案 0 :(得分:2)

好的,只是在zend文档中看到了用法

#
// Load a PDF document from a file
#
$pdf2 = Zend_Pdf::load($fileName);
#

#
// Load a PDF document from a string
#
$pdf3 = Zend_Pdf::parse($pdfString);
#
...

这是加载PDF文件的方式。

答案 1 :(得分:0)

检查目录路径。可能需要设置为set_include_path (__DIR__ . '\data\');

答案 2 :(得分:0)

PDF文件是受版权保护的,我猜:)使用其他文件 - 比如从互联网下载一些东西。

答案 3 :(得分:0)

我有一个类似的问题,一段时间后我收到了某人的pdf。我不得不完全删除密码保护,以便Zend完全使用它。 Zend不会修改任何加密的文档。我最终得到了一个PDF解密器来完成这项工作,如果你丢失了原来的密码就有很多。