我想使用任何Freely available pdf库(如PDFSharp,ItextSharp)将pdf导出为xml,其字体信息包括字体大小,字体名称,字体样式,字间距,字母间距等。
例如:
< p font-style =“10pt”,font-style =“italic”letter-spacing =“somevalue”word-spacing =“somevalue”>段落文字在这里< / p>
是否可以使用C#?如果可能我在哪里可以获得相关信息?
答案 0 :(得分:0)
开源项目PDF Clown可能对您有所帮助。以下是其功能页面的网址,其中包含带格式信息的文本导入。然后,您可以将其转换为XElement,XAttribute等等和/或最后将XMLSerialize转换为xml文档。
http://www.stefanochizzolini.it/en/projects/clown/features.html
sourcefourge下载如下: