应用错误收集

我需要解析一些html

<span>Unique text</span>
<a href="...">Text 1</a><br>
<a href="...">Text 2</a><br>
...
<a href="...">Text N-1</a><br>
<a href="...">Text N</a><br>

我需要所有“文字......”，但我不知道究竟是什么N.所以我写了这个正则表达式

<span>Unique text</span>(?:<a href="[^"]*">([^<]*)</a><br>){1,}

使用该正则表达式我只能得到第一个“文本...”，但我需要来自所有链接的文本。有可能吗？

UPD

我使用此代码

boost::smatch result;
boost::regex regex("(?:<a href=\"[^\"]*\">([^<]*)</a><br>){1,}");
boost::regex_search(html.cbegin(), html.cend(), result, regex);
// here result[1] is matched

UPD

如上所示，没有答案。

提升正则表达式 - 获取重复组

0 个答案: