我有一个简单的HTML文件,只包含一个没有CSS或任何其他属性的表。该文件的结构永远不会改变,但其内容总是不同的。
我尝试匹配特定单元格(td)的内容,这将给出名称 首次出现的联系,其中类型'杂项'即可。
在我的例子中,我尝试匹配“Michael Jackson”这个名字:
这是我到目前为止所得到的:
(<td>\s*Contact:\s*<\/td>((?!<br>).)*<td>\s*Misc\s*<\/td>)
但这只选择包含“Misc”类型的两个接触块。我不知道如何从这一点开始......
这里再次是我的正则表达式和我正在使用的HTML字符串:
感谢您提供任何帮助或建议!