我面临很多问题,将页面上的html数据转换为pdf和doc,确保图片也出现在已转换的文章中但失败了
我知道XML就像一个基础
是这样吗?
以及如何使用它?
我的意思是如何生成页面的xml,然后将其扩展名更改为所需的(pdf,doc)?
使用vs08,asp.net,c#
答案 0 :(得分:4)
简短的回答是否。
如果有这样的格式,为什么所有应用程序都不会首先使用它?
以HTML为例。 HTML适用于在网站上流动文本,其中包含由滚动条导航的连续文本块。没有分页符,可以根据屏幕大小等适应不同的列宽.HTML也非常动态,页面可以扩展部分,替换内容并对用户输入作出反应。
相反,请使用PDF。 PDF是面向页面的,固定的页面宽度和高度。它也只针对观看。文本环绕是通过显式换行符修复的。 (将文本从PDF复制到Word文档,并在一行中间插入一些文本,并且断行将是一个真正的混乱)。 PDF正在模拟带有边距和所有内容的打印页面。
中间的某个地方是Word文档。面向PDF的页面,但不像PDF文档那样固定,以支持良好的编辑体验。当文本插入中间时,文本部分可以很好地重排。编辑时非常灵活,但最终结果与PDF格式一样严格。打印Word文档时,打印输出看起来与屏幕上的完全相同。
没有给定将给定文档格式转换为XML的方法,甚至没有像DocBook这样的给定XML格式。基于XML的格式可用作源格式,以生成不同的可视格式。
然后,您需要一个工具,使用某种工具从模板生成每种输出格式。