在php中从pdf数据流中提取文本

时间:2012-11-08 14:46:57

标签: php pdf text

  

可能重复:
  extracting content from pdf using PHP

我有一个url,它返回一个带有一些pdf数据和html的页面...我删除了HTML部分,现在数据字符串包含pdf格式的数据。我需要从这个字符串中提取pdf文件的文本内容。有没有办法在PHP中做到这一点?我用google搜索,发现没有办法做到这一点..数据以%PDF开头,以EOF .B / w结尾,有一些无法识别的字符(可能是二进制数据)< / p>

1 个答案:

答案 0 :(得分:0)

您可以使用pdftotext申请来获​​取pdf的内容。