Powershell从HTML文件(或变量)中删除文本块

时间:2015-01-27 12:11:29

标签: powershell

我有许多HTML文件,并尝试使用PowerShell删除特定的文本块。 该块出现在每个表格中。

      <tr>
        <td colspan="3">
          <div id="reportbody">*TEXT*<a target="_blank" href=*LINK*</a></div>
        </td>
      </tr>

我可以在第3行进行-replace以停止文本/链接显示,但我在表格中看到一个空白行。 我尝试了类似于post的东西,但我没有独特的开始/结束标记。 非常感谢任何帮助。

1 个答案:

答案 0 :(得分:0)

一种方式:

$regex = 
@'
(?ms)\s*<tr>\s*
\s*<td colspan="3">\s*
\s*<div id="reportbody">\*TEXT\*<a target="_blank" href=\*LINK\*</a></div>\s*
\s*</td>\s*
\s*</tr>\s*
'@



(Get-Content ./file.htm -raw) -replace $regex |
 Set-Content ./newfile.htm