使用正则表达式解析简单HTML表单/表的标记内容

时间:2018-03-06 15:58:36

标签: html regex

我有一个简单的HTML文件,只包含一个没有CSS或任何其他属性的表。该文件的结构永远不会改变,但其内容总是不同的。

我尝试匹配特定单元格(td)的内容,这将给出名称 首次出现的联系,其中类型'杂项'即可。

在我的例子中,我尝试匹配“Michael Jackson”这个名字:

HTML table

这是我到目前为止所得到的:

(<td>\s*Contact:\s*<\/td>((?!<br>).)*<td>\s*Misc\s*<\/td>)

但这只选择包含“Misc”类型的两个接触块。我不知道如何从这一点开始......

这里再次是我的正则表达式和我正在使用的HTML字符串:

感谢您提供任何帮助或建议!

0 个答案:

没有答案