我能够在Windows 8.1 + Xampp上安装TET(php_tet.dll),我对PDF到文本没有任何问题,但我对图像提取没有运气。
我正在使用示例“image resources.php”(和“image_extractor.php”),它应该“打印”PDF格式的一些信息(x,y,宽度,高度,alpha等)文件。还必须将所有可用(或任何)图像保存/提取到文件中(tiff,jpg)。
可以在此处找到示例:http://goo.gl/ZeDlc0
包含图像信息的部分正在运行,但没有提取文件。
我在同一文件夹中将文本提取到TXT文件没有任何问题。 所以我能写在那里吗?
我的SEARCHPATH出了什么问题?
我的尝试:
原始示例抛出ERROR:
Error 1016 in open_document(): Couldn't open PDF file 'FontReporter.pdf' for reading (file not found)
所以我改变了SEARCHPATH:
/* global option list */
$globaloptlist = "searchpath={{../data} {../../data} }";
我的pdf文件的位置:
/* global option list */
$globaloptlist = "searchpath={{D:\Workshop\www\TET\data} }";
现在我有一些输出数据通过print / echo:
page 7: 208x277pt, alpha=0, beta=0 id=0, 595x750 pixel, 1x8 bit Indexed
page 7: 208x277pt, alpha=0, beta=0 id=1, 595x750 pixel, 1x8 bit Indexed
$ tet-> write_image_file 方法返回10,表示“我可以提取TIFF文件”。
但是我的pdf文件夹或周围的任何地方都没有提取图像......
答案 0 :(得分:0)
以某种方式将图像导出到D:\ workshop \ xampp \ apache
在选项FILENAME中,我需要设置ABSOLUTE路径和文件名......
$path = str_replace('\\', '/', __DIR__);
$imageoptlist = $baseimageoptlist . " filename {".$path."/out/" .
$outfilebase . "_p" . $pageno . "_I" . $ti->imageid . "}";
if ($tet->write_image_file($doc, $ti->imageid, $imageoptlist) == 0){
print("Error " . $tet->get_errnum() . " in " .
$tet->get_apiname() . "(): " . $tet->get_errmsg());
}
答案 1 :(得分:0)
这正是我在TET手册中找到的,(第3.9章“PHP”部分):
File name handling in PHP
Unqualified file names (without any path component) and relative file names are
handled differently in Unix and Windows versions of PHP:
- PHP on Unix systems will find files without any path component in the directory
where the script is located.
- PHP on Windows will find files without any path component only in the directory
where the PHP DLL is located.
所以我想,您需要根据需要稍微调整样本。