我想将pdf导出为xml,并将字体信息作为属性值

时间:2010-09-20 09:33:04

标签: c# itextsharp pdfsharp

我想使用任何Freely available pdf库(如PDFSharp,ItextSharp)将pdf导出为xml,其字体信息包括字体大小,字体名称,字体样式,字间距,字母间距等。

例如:

< p font-style =“10pt”,font-style =“italic”letter-spacing =“somevalue”word-spacing =“somevalue”>段落文字在这里< / p>

是否可以使用C#?如果可能我在哪里可以获得相关信息?

1 个答案:

答案 0 :(得分:0)

开源项目PDF Clown可能对您有所帮助。以下是其功能页面的网址,其中包含带格式信息的文本导入。然后,您可以将其转换为XElement,XAttribute等等和/或最后将XMLSerialize转换为xml文档。

http://www.stefanochizzolini.it/en/projects/clown/features.html

sourcefourge下载如下:

http://sourceforge.net/projects/clown/