PHP PDF解析器用单词

时间:2016-02-08 10:39:40

标签: php pdf pdf-parsing

我正在使用此PDFParser来解析PDF文件。突然,其中一个文件被解析为单词中的空格,例如应该有

  

周一

,但它被解析为

  

Mond ay

  

as

  

chic ken

当我从pdf阅读器中选择文本并复制到其他地方时,没有这些奇怪的空白。库中是否有错误或pdf中有一些隐藏的字符。它是如何修复的?

编辑:每周菜单link。这个PDF文件是捷克语,所以有例如单词

  

Pondělí

应该是:

  

Pondělí

  

Kuřecí

应该是:

  

Kuřecí

我可以看到所有这些空格都是带有重音的字符,但并非总是如此。

我警告你,本周之后它可能会改变,新菜单可能没有这些空格。

0 个答案:

没有答案