PDF在浏览器和口径输出中混淆阿拉伯文pdf中的字母

时间:2019-03-26 16:02:30

标签: php pdf unicode arabic calibre

我正在使用Calibre电子书将pdf文件提取到epub电子书 但是convert之后的文本[[并且由于再次被自动反转而再次受到尊敬],与pdf主文本中的文本不同

让我们说pdf文本是

  

لمياءالسعيد

我扭转后的口径结果是

  

ملياءالسعيد

这里的单词不同

  

لمياء

     

ملياء

这发生在许多pdf文本中

我用口径进行转换

exec('ebook-convert '.$pdffile.' '.$new_epub_file ) ;

此步骤中的字母放置错误 结果就像

  

ءايلم(错误和相反)​​

用php反转后的结果是

  

ملياء(错误)

我尝试使用

  

-disable-font-rescaling --mono-family --keep-ligatures --change-justification

全部失败

经过一番搜索,我看到一些答案说 嵌入式字体支持阿拉伯语,但也失败

在阅读pdf时也在浏览器中

“ perapper罚款”单词“لمياء”

但是,如果我尝试将其复制到剪贴板,则会将其复制为“ملياء”

如何使用阿拉伯字母解决此问题

0 个答案:

没有答案