如何从此HTML中提取产品权重

时间:2010-04-27 18:26:34

标签: java regex

我的HTML看起来像这样:

<td class="main"><b>Product Weight  (2.83 lbs in 1 container)</b></td>

我需要从HTML中获取值2.83。

需要有关正则表达式的帮助。

我有这个:

    Pattern p = Pattern.compile(

  "<td\\sclass=\"main\"><b>Product\\sWeight\\s\\s((?:\\d+\\.)?\\d+ \\w{3})");

但似乎没有起作用。

我错过了逃避或其他什么?

更新

如果括号是个问题,我可以这样做吗(或者也可以在内括号上?

2 个答案:

答案 0 :(得分:2)

看起来你错过了字面括号的转义。

答案 1 :(得分:1)

为获取特定的html标签,我推荐使用Regex的HTML解析器。 例如,您可以使用this html-parser。