可搜索的pdf到text / pdf,其中印地语字体已使用字形正确映射

时间:2018-07-16 11:49:25

标签: python pdf fonts glyph

我有一个可搜索的pdf [语言:印地文]示例:https://www.ceorajasthan.nic.in/erolls/pdf/dper-18/A151/A151001.pdf

我有用于下载链接(http://ceorajasthan.nic.in/erolls/pdf/Forms/mfdev010.ttf)的字体文件

我想集成这种字体,如果字形被破坏,我想正确地映射它。

我设法获得了带有以下行的字形文件:

(Abc.glf) 131 | 0xc1 |急性| 00c1 | 400b0234121005002502120526002b35012b35 |

pdf具有devnagri脚本,我无法进行任何改进。任何帮助都会有所帮助。

我使用的语言是python 2.7

0 个答案:

没有答案