我想从一些博客网站上捕捉一些博客。我知道使用HttpClient来获取html字符串,然后使用Html Agility Pack来捕获特定html标记下的内容。但是如果你使用WebView来显示这个html字符串,你会发现它在移动设备上并不好用。例如,将无法正确加载css样式。某些代码块不会自动换行。有些图片不会显示(会显示x)。
有些广告也会显示,但我不想要它。
有谁知道如何获得它?任何建议都会适用。
答案 0 :(得分:0)
尝试通过类似Google Mobilizer的内容运行html字符串。这应该是一个更加移动友好的html字符串,然后您可以使用Agility包来“解压缩”
答案 1 :(得分:0)
理想情况下,您应该捕获HTML页面及其所有相关资源:CSS文件,图像,脚本,...... 然后更新HTML内容,以便从本地数据存储中检索资源(例如,如果您在本地保存HTML页面,则相对URL将不再有效。)
您也可以使用User-Agent
标头发送您的HTTP请求,该标头与Microsoft浏览器使用的标头相对应,以便从网站获取相应的版本(如果他们进行某种类型的用户代理嗅探)。