我有许多HTML文件,并尝试使用PowerShell删除特定的文本块。 该块出现在每个表格中。
<tr>
<td colspan="3">
<div id="reportbody">*TEXT*<a target="_blank" href=*LINK*</a></div>
</td>
</tr>
我可以在第3行进行-replace以停止文本/链接显示,但我在表格中看到一个空白行。 我尝试了类似于post的东西,但我没有独特的开始/结束标记。 非常感谢任何帮助。
答案 0 :(得分:0)
一种方式:
$regex =
@'
(?ms)\s*<tr>\s*
\s*<td colspan="3">\s*
\s*<div id="reportbody">\*TEXT\*<a target="_blank" href=\*LINK\*</a></div>\s*
\s*</td>\s*
\s*</tr>\s*
'@
(Get-Content ./file.htm -raw) -replace $regex |
Set-Content ./newfile.htm