将hindi / arabic charset从pdf文件转换为mobi文件

时间:2011-07-31 13:22:37

标签: pdf type-conversion kindle

我正在创建一个在线服务,我完全不知道从哪里开始多语言pdf到mobi文件转换。我已经创建了一个英语应用程序,这很简单,但pdf和多字节字符集的问题在于它们被解释为图像,这意味着它们不会被解释为mobi文件格式的单词。

有没有办法/在线服务/ api /代码来实现/实现这个?任何可以在文件到文件的基础上执行此操作的Windows应用程序都可以正常...

1 个答案:

答案 0 :(得分:1)

您需要为此编写自己的插件,因为市场上不支持此功能。 但是,您可以使用自定义的字母映射转换它,这意味着每个图像首先由ocr读取,然后用于查找utf等效值。