String inputs ="td class=\"prodcatnamelinkwrap\"";
Pattern p = Pattern.compile("<td cellspacing=\"0\" align=\"center\" valign=\"bottom\" class=\"prodcatimagewrap\">");
Matcher m = p.matcher(inputs);
我应该怎么做才能匹配这种格式。 任何人帮助我 提前致谢
find方法如何工作。 我必须在本文
中匹配td height =“45px”valign =“top”td align =“center”height =“45px”valign =“top”&gt;。
但它一直都是假的
For reference please find my code
Pattern replace5 = Pattern.compile(".*\r?\n",Pattern.MULTILINE);
Matcher matcher5 = replace5.matcher("td[@height=\"45px\"][@valign=\"top\"]".replaceAll("[\\[\\@]+"," "));
pattern3 = Pattern.compile(matcher5.replaceAll(" ").replaceAll("\\//", "").replaceAll("\\]",""));
pm3 = pattern3.matcher("<td align="center" height="45px" valign="top">");
if(pm3.find())
....It always results in false.Can anyone help me out
答案 0 :(得分:1)
不要重新发明轮子。使用像jsoup这样的html解析器。
Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
Elements newsHeadlines = doc.select("#mp-itn b a");