如何从html页面中读取所有文本和图像,例如
http://wireless.ign.com/articles/118/1186400p1.html
让我们说我想获取页面上的文字和最新的图片?
我将如何做到这一点?
通过HTTPGET请求?如果是这样的话?
如何获取此文本,然后使用它和图像执行某些操作,例如将其设置为文本视图,并将图像设置为ImageView。
答案 0 :(得分:1)
在unix / linux中使用以下代码 wget http://wireless.ign.com/articles/118/1186400p1.html -O test.html
答案 1 :(得分:0)
使用HttpURLConnection获取html,然后使用Regex或JSoup之类的东西来解析Html。