获取mutool以输出“结构化文本(作为xml)”

时间:2018-08-22 14:52:32

标签: pdf mupdf structured-text

遵循mutool的draw命令说明
https://mupdf.com/docs/manual-mutool-draw.html

当输出“矢量格式”之一是“调试跟踪(作为xml)”并且“从输出文件名推断出输出格式”时,如何输出“结构化文本(作为xml)”?

如果我运行

mutool draw -o "testfile.xml" "testfile.pdf"

看来我得到了“调试跟踪(作为xml)”文件格式。

我应该使用什么文件扩展名来确保输出“结构化文本(如xml)”格式?

1 个答案:

答案 0 :(得分:1)

如果您在不带任何参数的情况下运行“ mutool draw”,则使用消息会告诉您所支持的格式以及其文件扩展名。

在您的情况下,您需要“文本”输出。

mutool draw -o out.stext input.pdf
mutool draw -F stext -o out.xml input.pdf

或者,如果您更喜欢“ mutool convert”命令,该命令使用-O参数支持高级输出选项。

mutool convert -o out.stext input.pdf