如果没有任何意义,请不要完全确定如何言喻这一点。
我在一个网站上,我需要从特定对象中提取所有数据,它看起来类似于在线电子书,你会在大学图书馆页面上看到的等等。
我浏览了HTML并看到它使用了Aspose:
<meta name="generator" content="Aspose.Words for .NET 15.5.0.0">
我想知道是否有人可以给我建议或指出我正确的方向,以便我可以从这个在线电子书中提取所有数据到我可以离线使用的PDF格式?
谢谢,
答案 0 :(得分:1)
您只需将网页加载到Aspose.Words for .NET document object model (DOM):
即可Document doc = new Document("abc.com/somepage.html");
将网页加载到Document对象后,您可以使用以下代码选择extract Selected Content Between Nodes in a Document或convert the entire web page to PDF format:
Document doc = new Document("abc.com/somepage.html");
doc.Save(MyDir + @"17.6.pdf");
希望,这有帮助。
我与Aspose一起担任开发者布道者。