我的客户希望我们为他们的应用构建自定义文档查看器。 (它确实需要定制,因为它们需要大量特定于应用程序的功能。)
我们去年为他们建了一个用PDF,生成页面图像,并使用可以选择和复制的隐藏文本层支持图像。我们在Flex中做到了。这是一场噩梦。 PDF很可怕。
今年,我们需要在HTML 5中构建一个具有类似要求的版本,除了大多数文档现在都是Word或HTML,也就是说,它们具有可重排文本,而不是PDF的固定布局和字形。但是他们仍然想在同一个观众中做PDF。
我认为我们需要将所有文档转换为一些通用文件格式,可以处理可重排文本以及PDF的固定位置字形。 (每个文件可能支持一个或另一个,但不是两者都支持)。如果它是一种类似XML的标记语言会更好:
<text>here's some text</text>
-- or --
<glyph letter="a" name="my_a_glyph" position="10,10"/>
<image src="my_image" position="20,20"/>
或类似的东西。
是否有可以处理它的现有文件格式? EPUB不会做固定位置的文本,而PDF很难描述。
答案 0 :(得分:0)
我认为你可以看看FB2(FictionBook 2)格式。这是一种基于XML的格式,专为出版书籍而设计。它包括图像,但我不确定它们是否可以绝对对齐。
此外,您可以简单地使用HTML并在需要时进行HTML到PDF渲染(为此存在各种组件和库)。我没有看到(或者你没有列出)这种方式不起作用的任何原因。
答案 1 :(得分:0)
格勒夫?也许根据需要构建一个宏库来定制它。
Groff / troff / nroff,Unix的“run off”程序,可以输出到postscript或HTML。从postscript到PDF的跳转内置于一些PDF查看器中;例如,还有几个现有的程序,例如pstopdf。
GROFF有一些固定的布局选项和一些类似流的选项。使用GROFF,将大部分打印输出基于流动文本,在被禁止的范围内,几乎更容易。