我需要将PDF文件转换为HTML。
我可以通过几个步骤手动执行此操作,使用此(Rube)Goldberg变体:
0) Save PDF as text
1) Copy-and-paste text into MS Word
2) Save MS Word doc as HTML
但是,我觉得我正在这样做。
有没有一种程序化的方法来实现同样的目标?所以我可以做类似的事情:
string htmlFile = ConvertPDFToHTML("FrumiousBandersnatch.PDF");