我需要解析一些html
<span>Unique text</span>
<a href="...">Text 1</a><br>
<a href="...">Text 2</a><br>
...
<a href="...">Text N-1</a><br>
<a href="...">Text N</a><br>
我需要所有“文字......”,但我不知道究竟是什么N.所以我写了这个正则表达式
<span>Unique text</span>(?:<a href="[^"]*">([^<]*)</a><br>){1,}
使用该正则表达式我只能得到第一个“文本...”,但我需要来自所有链接的文本。 有可能吗?
UPD
我使用此代码
boost::smatch result;
boost::regex regex("(?:<a href=\"[^\"]*\">([^<]*)</a><br>){1,}");
boost::regex_search(html.cbegin(), html.cend(), result, regex);
// here result[1] is matched
UPD
如上所示,没有答案。