使用正则表达式在Java中获取HTML行的一部分时遇到问题

时间:2013-04-28 22:40:46

标签: java html regex

我正在尝试使用正则表达式在HTML行中获取一行,但我无法使其工作。

这是html(必要)部分:

(five random numbers)/ ">(the word I want to extract, between 2 and 45 characters)<

所以我正在使用这个正则表达式:

"[0-9]{5}\\/\\\"\\s\\>(\\.{1,45})\\<"

我无法让它发挥作用......

当我group() .find() Matcher之后,当我尝试通过{{1}}说出来时,我总是得到“找不到匹配”。希望我足够清楚!

1 个答案:

答案 0 :(得分:2)

这应该做:

"[0-9]{5}/\"\\s>(.{1,45})<"

也许更好

"\\d{5}/\"\\s*>([^<]{1,45})<"

还允许捕获换行符,并防止以后的第二个<结束。