我一直在创建一个应用程序来创建各种文档格式,但我的成功有限。
理想情况下,我想动态创建一个相当简单的ODT / PDF / DOC文件。我一直专注于ODT,因为它是可编辑的,并且足够开放,有几种工具可以将它转换为我需要的任何其他格式。
问题是ODT XML文件并不简单,而且我找不到任何高质量的API(特别是在python中)。到目前为止,我最成功地创建了一个模板ODT文件,然后根据需要在python中操作DOM。这通常是正常的,但很快变得不充分,每次我需要更改其中一个模板时需要进行太多的调整。
要求是:
1)制作一个简单的文档,其中包含列表,段落以及在页面上绘制简单图形的能力(方框,圆圈等等)
2)指定页面大小的能力以及不同的格式通常应该在发送到打印机时打印完全相同的输出
我的问题:
1)我还有其他方法可以制作ODT / PDF / DOC文件吗?
2)LaTeX会被接受吗?我从来没有真正使用它,有没有人有将LaTeX文件转换成其他格式的经验?
3)是否可以使用HTML?网上有很多转换器。从技术上讲,您可以指定尺寸单位为mm / cm等,但我担心浏览器/转换器的打印输出会有所不同....
还有其他想法吗?
答案 0 :(得分:1)
你试过pandoc吗?我一直在使用它,并将不同格式转换成彼此。为什么要尝试两次发明轮子?
答案 1 :(得分:1)
谢谢,哈比。我确实看过Pandoc,但它的网站上说它没有读过DocBook XML,它只是写它。它可以“读取降级和(子集)reStructuredText,HTML和LaTeX”。
现在,我可以尝试使用DocBook-> HTML然后HTML-> ODT的路线。我不知道会有多少信息丢失;无论如何,它值得一试......
...好吧,我刚刚尝试在http://johnmacfarlane.net/pandoc/try使用他们的在线转换器,其中包含相关书籍的完整HTML文本,produceoss.com / en / productioning.html(请注意,此HTML是从DocBook XML生成的大师)。对于dest格式,我选择了“OpenDocument XML”。
500内部服务器错误 超时
好吧,也许这太大了。让我尝试一些更小的东西:
producingoss.com/en/bug-tracker.html
...看起来很体面的OpenDocument XML输出,只有文本的主体替换为“TRUNCATED!如果要转换大文件,请下载pandoc”。所以我必须下载并尝试一下。
答案 2 :(得分:0)
我想要成功,你必须定义你想要输入的东西。你为什么不使用openoffice?它将保存到ODT(duh ...),PDF和HTML(虽然它不是干净的HTML,但它实际上非常难看。)
在我最近的经历中,我从乳胶中取得了成功 - > xhtml通过LaTeXML(我必须从源代码编译)。 LaTeX似乎越来越像终端格式。它对PDF很有用,但是一旦你需要一些灵活性,它就会失败。我还应该注意到没有乳胶 - > dvi在我的工作流程中,所以我无法评论像tex4ht这样读取dvi文件的内容(我有太多的图形无法与DVI一起使用来切换它们)。
我很快就会将所有内容都移到docbook 4.5中 - 我喜欢docbook-utils包,它支持latex,html,我甚至看到了ODT的转换器。但是docbook在标记上非常沉重,这很烦人,但它将为我提供我需要的灵活性。
既然你正在使用python,你刚考虑过使用ReStructured Text吗?
我也非常喜欢从emacs的orgmode发布,这是一个超轻量级标记,可以分为多种格式。
答案 3 :(得分:0)
云母,你看过这个DocBook-> ODT转换器?我也需要这样做。 (Pandoc似乎没有阅读DocBook Lite XML。)