标签: grep pcregrep
我必须编写一种模式来在HTML表中查找非法行。下表如下:
我无法弄清楚如何为4编写模式。 这是我到目前为止所做的。
pcregrep -M -o "<table>((\s+<tr>((<td>\w*</td>)*)\w*</tr>))*((\s+<tr>\5\w*</tr>))*(\s+</table>)" file_1.txt
我认为我以错误的方式重新引用了(\ w *)*。当列数不相等时,它甚至可以匹配行。