正则表达式字符串修改

时间:2012-05-08 16:36:53

标签: java regex oop

我有以下字符串,我想用Java中的正则表达式过滤MBRB1045T4G。我将如何实现这一目标?

字符串:

<p class="ref">
<b>Mfr Part#:</b>
MBRB1045T4G<br>


<b>Technologie:</b>&nbsp;
    Tab Mount<br>



<b>Bauform:</b>&nbsp;
    D2PAK-3<br>



<b>Verpackungsart:</b>&nbsp;
    REEL<br>



<b>Standard Verpackungseinheit:</b>&nbsp;
    800<br>

1 个答案:

答案 0 :(得分:3)

正如Wrikken所说,在一般情况下,正则表达式无法正确解析HTML。然而,似乎你正在寻找一个真实的网站,并希望刮掉一些内容。在这种情况下,假设HTML代码中的空格元素和格式不会改变,您可以使用这样的正则表达式:

 Mfr Part#:</b>([^<]+)<br>

并像这样收集第一个捕获组(其中string是您的HTML):

Pattern pt = Pattern.compile("Mfr Part#:</b>\s+([^<]+)<br>",Pattern.MULTILINE);
Matcher m = pt.matcher(string); 
if (m.matches())
    System.out.println(m.group(1));