从.HTML文件中剥离所有[stringxyz]

时间:2016-03-25 23:35:10

标签: html regex

  1. 我有包含表格的HTML文件。
  2. 我想从文件中删除表格。
  3. 我不太了解正则表达式,也无法弄清楚如何查找/替换[stringxyz]的所有内容(这将留下页脚,但我想我以后可以删除它)。
  4. 我试过[\ s \ S],但它似乎不适用于TextCrawler3。
  5. 提前感谢所有建议(包括不同的策略)。

1 个答案:

答案 0 :(得分:1)

你在找这样的东西吗?

当前输入:

<b><i>some text and tag
is hare</i></b>
<table>
    <tr>
        <td>
            it is a row
        </td>
    </tr>
</table>
<p>some text else is here</p>

预期输出:

<b><i>some text and tag
is hare</i></b> 
<p>some text else is here</p>

如果是,请尝试:

/<table>[\s\S]+<\/table>/

Online Demo