提升正则表达式 - 获取重复组

时间:2015-07-01 12:27:28

标签: c++ regex boost

我需要解析一些html

<span>Unique text</span>
<a href="...">Text 1</a><br>
<a href="...">Text 2</a><br>
...
<a href="...">Text N-1</a><br>
<a href="...">Text N</a><br>

我需要所有“文字......”,但我不知道究竟是什么N.所以我写了这个正则表达式

<span>Unique text</span>(?:<a href="[^"]*">([^<]*)</a><br>){1,}

使用该正则表达式我只能得到第一个“文本...”,但我需要来自所有链接的文本。 有可能吗?

UPD

我使用此代码

boost::smatch result;
boost::regex regex("(?:<a href=\"[^\"]*\">([^<]*)</a><br>){1,}");
boost::regex_search(html.cbegin(), html.cend(), result, regex);
// here result[1] is matched

UPD

如上所示,没有答案。

0 个答案:

没有答案