我正在使用Readability Parser API来获取页面内容
收到结果后,内容将转到 kidlegen.exe (生成.mobi),然后通过电子邮件发送给我的kindle。问题是我从Readability Parser API获得的内容包含<img>
到远程图像,因此我需要下载它们,然后才启动 kindlegen.exe 。
问题是如何以有效的方式将文章中的远程图像下载到我的磁盘?我只能看到一个解决方案 - 使用regexp来解析响应以提取<img>
,然后提取scr
属性并最终下载图像,但这绝对是最糟糕的方式。
我正在使用ASP.NET MVC
。
答案 0 :(得分:0)
看起来我需要HtmlAgilityPack
。我将此任务从Web应用程序分离到控制台。