我想从android中的网站html标签之间提取数据。

时间:2014-01-25 11:24:51

标签: php android

如何在android中从网站的span标签中提取数据?我正在尝试使用php和android,但没有得到结果,请你帮我解决这个问题。 请在下面找到我们想要提取突出显示数据的代码。

Número<br /></span><span class="linha">**3943**</span></td><td valign="top" height="30" width="25%"><span class="TextoFundoBrancoNegrito">
Série<br /></span><span class="linha">**0**</span></td><td valign="top" height="30" width="25%"><span class="TextoFundoBrancoNegrito">
Data de emissão<br /></span><span class="linha">**26/08/2013**</span></td></tr></table><table align="center" width="98%"><tr><td class="TituloAreaRestrita">

我想在String中存储数据“3943”,“0”,“26/08/2013”​​。

2 个答案:

答案 0 :(得分:1)

您可以使用Regular Expressions从HTML中提取数据。

使用以下代码在span标记之间提取数据:

String value = regexMatch(HTML, "<span class=\"linha\">(.+?)</span>");

这是功能:

public static String regexMatch(String source, String compilePattern) {
    // Compile regex pattern
    Pattern regexPattern = pattern.compile(compilePattern);

    // Create a matcher against input
    Matcher regexMatcher = regexPattern.matcher(source);

    // Find first match
    if (regexMatcher.find()) {
        // Return first group
        return RegexMatcher.group(1);
    }

    // Return empty string if no match
    return "";
}

答案 1 :(得分:0)

您正在使用字符串paser或子字符串方法...这对于任何开发人员来说都是相当标准的。你目前使用的是什么代码?

基本上,您将整个html数据加载到一个字符串中,然后将其拆分为仅需要的内容。这可以通过拆分方法来完成,这种方法将字符串拆分成数组或其他方式......这个主题已经被多次覆盖......