Java Matcher类

时间:2011-10-05 02:30:38

标签: java

我需要一个模式匹配器来获取来自http响应主体的以下文本中的页面id值。

<meta name="ajs-page-id" content="262250">

我所追求的是从此行获取始终在responsebody中生成的内容值。

2 个答案:

答案 0 :(得分:2)

Pattern pat = Pattern.compile("<meta\\sname=\"ajs-page-id\"\\scontent=\"(\\d+)\">");

这显然是一个非常文字的模式......但是组(1)应该将数字作为字符串返回。 尚未测试过。

答案 1 :(得分:1)

使用像jsoup这样的HTML解析器来解析和搜索零件。你不应该使用正则表达式。

如,

String htmlStr = "<meta name=\"ajs-page-id\" content=\"262250\">";
Document doc = Jsoup.parse(htmlStr);
Element meta = doc.select("meta[name=ajs-page-id]").first();
if (meta != null)
{
    System.out.println(meta.attr("content"));
}