Question

我有以下字符串，我想用Java中的正则表达式过滤MBRB1045T4G。我将如何实现这一目标？

字符串：

<p class="ref">
<b>Mfr Part#:</b>
MBRB1045T4G<br>


<b>Technologie:</b>&nbsp;
    Tab Mount<br>



<b>Bauform:</b>&nbsp;
    D2PAK-3<br>



<b>Verpackungsart:</b>&nbsp;
    REEL<br>



<b>Standard Verpackungseinheit:</b>&nbsp;
    800<br>

Answer 1

正如Wrikken所说，在一般情况下，正则表达式无法正确解析HTML。然而，似乎你正在寻找一个真实的网站，并希望刮掉一些内容。在这种情况下，假设HTML代码中的空格元素和格式不会改变，您可以使用这样的正则表达式：

 Mfr Part#:</b>([^<]+)<br>

并像这样收集第一个捕获组（其中string是您的HTML）：

Pattern pt = Pattern.compile("Mfr Part#:</b>\s+([^<]+)<br>",Pattern.MULTILINE);
Matcher m = pt.matcher(string); 
if (m.matches())
    System.out.println(m.group(1));

正则表达式字符串修改

1 个答案: