我使用unoconv(https://github.com/dagwieers/unoconv)将DOCX和DOC文件转换为PDF,但在PDF中呈现某些字符时,往往会得到奇怪的结果。
一个特别的问题是数字奇怪地翻译,例如:
的部分标签第2.3节(http://note.io/1Q33RX6)
获得罗马数字:
第II.3节(http://note.io/1b6MDs5)
我觉得这与已安装的字符集有关,但不知道如何调试它。
该问题的设置是一个Django应用程序调用unix shell脚本来转换磁盘上的文档。
答案 0 :(得分:1)
unoconv只需以编程方式打开文件,然后将其保存/导出为所需的格式。当您使用LibreOffice打开文件并从GUI保存文件时,我希望会发生同样的情况。
如果是这种情况,您可能希望使用最新的LibreOffice版本进行测试,如果这不能解决您的问题,请将问题报告给LibreOffice错误跟踪器。