标签: php pdf control-characters pdf-parsing
我在解析此pdf文件时遇到问题:
http://www.transperfect.com/sites/default/files/imported/pdf/Tokyo_Client_Services_Representative.pdf
在我对FlateDecode解码的pdf文件进行编码后,输出如下:
通常,解析内容很容易,因为文本内容始终位于已打开的内容中("并且已关闭")"但这个pdf文件让我很头疼。 似乎括号内只有控制字符。
我目前的输出如下:
这里有谁对此有所了解?我做错了什么?