使用正则表达式JAVA从HTML内容中获取第二个div

时间:2013-05-02 09:48:28

标签: java regex

我有一个HTML代码,其中我有相同id的div,我们可以提取第二个。

HTML代码

<div id="test>example </div>
<div id ="test">example11</div>

我需要提取example11

这有效(?s)<div id="test>.*<div id ="test">(.*?)</div>,但我有很多具有相同ID的div,所以这不会很好,所以任何人都可以告诉我,我们还有其他方法来提取内容。

我知道REGEX不适合HTML配对,我别无选择。

1 个答案:

答案 0 :(得分:0)

试试这个!

<div.*>.*</div><div.*>(.*)</div>

现在您可以选择第一组。并完成;)

一个肮脏的解决方案

<div.*>.*</div><div.*>.*</div><div.*>.*</div><div.*>.*</div><div.*>.*</div><div.*>.*</div><div.*>.*</div><div.*>.*</div><div.*>.*</div><div.*>.*</div><div.*>(.*)</div>
嘿嘿嘿嘿嘿嘿嘿嘿嘿嘿嘿嘿嘿嘿嘿嘿嘿嘿嘿嘿嘿嘿嘿嘿嘿嘿嘿嘿嘿嘿