遵循mutool的draw
命令说明
https://mupdf.com/docs/manual-mutool-draw.html
当输出“矢量格式”之一是“调试跟踪(作为xml)”并且“从输出文件名推断出输出格式”时,如何输出“结构化文本(作为xml)”?
如果我运行
mutool draw -o "testfile.xml" "testfile.pdf"
看来我得到了“调试跟踪(作为xml)”文件格式。
我应该使用什么文件扩展名来确保输出“结构化文本(如xml)”格式?
答案 0 :(得分:1)
如果您在不带任何参数的情况下运行“ mutool draw”,则使用消息会告诉您所支持的格式以及其文件扩展名。
在您的情况下,您需要“文本”输出。
mutool draw -o out.stext input.pdf
mutool draw -F stext -o out.xml input.pdf
或者,如果您更喜欢“ mutool convert”命令,该命令使用-O参数支持高级输出选项。
mutool convert -o out.stext input.pdf