如何使用Regex获取字符串

时间:2016-09-29 01:30:16

标签: php regex

我想在td' s之间获取字符串,但其中一个td没有关闭标记。如何从这个标签中获取其他字符串。

<tr>
<td class="exclass">Text 0
<td class="exclass"><a href="exampleUrl">Text 1</a></td>
<td class="exclass"><a href="exampleUrl">Text 2</a></td>
<td class="exclass3" >Text</td >
<td class="exclass"> Text </td>
<td class="exclass3">Text</td>
<td class="exclass">Text</td>
<td class="exclass">Text</td><td class="exclass">Text</td>
<td class="exclass2">Text</td>
<td class="exclass">Text</td>
<td class="exclass" width="20"><a href="exampleUrl" rel="nofollow"><img src="exampleSrc"></a></td>
</tr>

正如您在下面的代码中看到的,我希望使用PHP获取Text 0和其他字符串。 到目前为止,我试图:

<td.+?>([\w\W]*?)<\/td.+?|<td

1 个答案:

答案 0 :(得分:1)

我假设因为其中一个td没有close标记,这就是你不能使用DOM解析器的原因。

这是我的正则表达式解决方案

(?<=>)([\s\w\n]+)(?=<)

https://regex101.com/r/BRaJAu/1