我正在使用此PDFParser来解析PDF文件。突然,其中一个文件被解析为单词中的空格,例如应该有
周一
,但它被解析为
Mond ay
或
鸡
as
chic ken
当我从pdf阅读器中选择文本并复制到其他地方时,没有这些奇怪的空白。库中是否有错误或pdf中有一些隐藏的字符。它是如何修复的?
编辑:每周菜单link。这个PDF文件是捷克语,所以有例如单词
Pondělí
应该是:
Pondělí
或
Kuřecí
应该是:
Kuřecí
我可以看到所有这些空格都是带有重音的字符,但并非总是如此。
我警告你,本周之后它可能会改变,新菜单可能没有这些空格。