Android HTTP请求 - 仅获取文本

时间:2014-01-14 17:41:03

标签: android

有没有办法只在网页上请求文字?

例如,页面中的图像太多,所以我不想在<中获取图像。 img src>标签

3 个答案:

答案 0 :(得分:1)

如果您通过HTTPClient请求网页,则会在HTMLResponse中返回HTML标记。从那里你可以正则表达/解析文本。在返回标记时,没有加载任何图像。

如果您正在谈论在WebView中请求页面,那么不,那是不可能的。

答案 1 :(得分:0)

不,除非您使用网络服务,否则我认为无法做到这一点,然后您可以调用仅为您提供服务的网络服务方法你需要什么...

基本上,当您向网页发出请求时,服务器的响应将是为您提供整个页面内容,因此如果您无法控制服务器端,则不会有可能只要求特定的数据。

答案 2 :(得分:0)

您可以发出仅检索HTML的HTTP请求。 This answer提供了如何发出HTTP请求的示例。

您将收回包含<img>标签的所有HTML - 这是不可避免的。但是,您不必获取图像标记的实际内容。相反,您可以使用android.text.HtmljsoupTagSoup之类的HTML解析器来只读取文本内容。

特别是

android.text.Html可能有用。来自Html.fromHtml的文档:

  

HTML中的任何<img>标记都会显示为一般替换图像,然后您的程序可以通过该图像替换为真实图像。

如果要向用户显示此HTML,则可以按照here所述进行操作。