使用正则表达式从特定HTML标记获取内容

时间:2014-06-27 00:59:44

标签: regex vb.net

我正在尝试找到一些与以下2个html标签匹配的正则表达式,并在两个单独的组中从它们中检索X和Y. X和Y可以是0-99999之间的任何整数。

<td align="right">X</td>
<td align="right">Y</td>

这是页面上唯一的2个标签,td align =“right”,我会感激任何帮助。

修改

我正在下载以下页面:http://thebootlegbay.com/search/ubuntu/0/7/0

下载我正在使用webclient.downloadstring

的页面

我想使用Regex捕获表格中每行的 SEEDERS LEACHERS ,包含在上述标记中,标记之间带有变量整数。

如果我可以捕获匹配组1中的第一行播种器和匹配组2中的leachers,这将是理想的,这将允许我遍历代码中的行并从每行捕获播种机和leachers。希望能解释一切。

1 个答案:

答案 0 :(得分:0)

您可以尝试以下正则表达式来提取<td>标记内的值。,

(?<=td align=\"right\">)([^<]*)

DEMO