使用c#将pdf转换为html / xml

时间:2010-08-03 10:15:32

标签: c# .net pdf-to-html

我希望使用c#将pdf转换为html ... 谁能请任何想法..

2 个答案:

答案 0 :(得分:0)

编辑(原始包含指向html的链接到pdf,而不是相反):

With Google, I got you this,即关闭(生成文本)。它应该给你一个起点。在this thread on asp.net中,它解释了如何使用该技术获取HTML(跳到代码示例)。

而且,在搜索引擎优化时,请搜索此pdf-to-html tag,然后find this post。查看iTextSharp的链接,它将为您提供PDF文档的界面。

答案 1 :(得分:0)

是的,请参见此处使用C#转换PDF的示例:https://github.com/pdftables/csharp-pdftables-api

您需要更改:

const string format = "xlsx-single";

成为

const string format = "xml";

const string format = "html";