PHP - 将PDF转换为文本(无权访问exec / shell_exec)

时间:2012-06-14 20:22:46

标签: php pdf exec pdftotext

案例:

  • 服务器不支持exec / shell_exec(因此不包括pdftotext)
  • 其他图书馆不接受PDF。 Pdftotext工作(在本地测试文件)

以下是(PDF)代码的摘录:


5 0 obj
>
stream
Gat$ugPXc?%"6H'p]ofd'_qs00UX27?3p0*8m>KOQL4]:u"*$$^'f*q*SGMee*e$5&=alj\@GV7YPq9pg!Lr0>Y2n'&lmd4Br?V9N
P:_",WI.kJ\#'cs>77M9eTkA;,t#f)aaGuNS-6=Wp*uBg,Ft9Tcj#aI]nD[C6&m@9m?m!p6=IBt=o_LGHh!q>f$C.jdOXbSP/796HV`_Y]Y
l)M(]FZ9Ld-J_mMRe2q(D>`V@G`NM]crn@_V?sGC@W9^bnrY$.mqeVN^YEcqK)blO~>
endstream
endobj

关于创作者:

%PDF-1.4
1 0 obj
>
endobj

我想获得一些关于如何在PHP中将其转换为纯文本的建议,而不使用exec / shell_exec函数。

谢谢。

(像http://webcheatsheet.com/php/reading_clean_text_from_pdf.php这样的其他解决方案不起作用,我无法让它们至少将此代码转换为类似ASCII代码的内容。)

1 个答案:

答案 0 :(得分:2)

您不能只需解析此流,然后使用文件中的大量其他数据(如字体编码)对数据进行解码。你真的想用一个库来做这件事......