我有以下字符串,我想用Java中的正则表达式过滤MBRB1045T4G
。我将如何实现这一目标?
字符串:
<p class="ref">
<b>Mfr Part#:</b>
MBRB1045T4G<br>
<b>Technologie:</b>
Tab Mount<br>
<b>Bauform:</b>
D2PAK-3<br>
<b>Verpackungsart:</b>
REEL<br>
<b>Standard Verpackungseinheit:</b>
800<br>
答案 0 :(得分:3)
正如Wrikken所说,在一般情况下,正则表达式无法正确解析HTML。然而,似乎你正在寻找一个真实的网站,并希望刮掉一些内容。在这种情况下,假设HTML代码中的空格元素和格式不会改变,您可以使用这样的正则表达式:
Mfr Part#:</b>([^<]+)<br>
并像这样收集第一个捕获组(其中string
是您的HTML):
Pattern pt = Pattern.compile("Mfr Part#:</b>\s+([^<]+)<br>",Pattern.MULTILINE);
Matcher m = pt.matcher(string);
if (m.matches())
System.out.println(m.group(1));