应用错误收集

时间：2015-04-18 23:04:20

标签： pdf docx doc document-conversion

我使用unoconv（https://github.com/dagwieers/unoconv）将DOCX和DOC文件转换为PDF，但在PDF中呈现某些字符时，往往会得到奇怪的结果。

一个特别的问题是数字奇怪地翻译，例如：

的部分标签

获得罗马数字：

我觉得这与已安装的字符集有关，但不知道如何调试它。

该问题的设置是一个Django应用程序调用unix shell脚本来转换磁盘上的文档。

答案 0 :(得分：1)

unoconv只需以编程方式打开文件，然后将其保存/导出为所需的格式。当您使用LibreOffice打开文件并从GUI保存文件时，我希望会发生同样的情况。

如果是这种情况，您可能希望使用最新的LibreOffice版本进行测试，如果这不能解决您的问题，请将问题报告给LibreOffice错误跟踪器。