如何使用Perl查找和清除字符串中的子字符串?

时间:2013-02-18 14:51:16

标签: html perl

我有一些我需要编辑的HTML文件。 我需要在文件中找到一些值并清理它。

例如我有html文件:

    .
    .
    Diagnostics
      align="right"
      align="right"
      align="right"
      align="right"
      align="right"
      align="right"
      align="right"

    Configuration
      align="right"
      align="right"
      align="right"
      align="right"
      align="right"
      align="right"
      align="right"
    .
    .

我需要找到并清理

    Diagnostics
      align="right"
      align="right"
      align="right"
      align="right"
      align="right"
      align="right"
      align="right"

来自我的HTML文件。

这是一种简单而快捷的方法吗?

感谢。

1 个答案:

答案 0 :(得分:2)

查看一个模块,例如HTML::TreeBuilder,用于解析Perl中的HTML。这不是一个非常简单的任务,但链接的文档有一些例子。如果您遇到麻烦,我建议您尝试并提出具体问题。

另一种方法是使用regular expressions。通常不推荐用于解析HTML - 不可能用正则表达式可靠地解析任意HTML。 然而,如果您只想从具有可预测格式的文件中快速删除某种东西,它可能是一个不错的选择。只需确保你的问题在走这条路线之前就像你想象的那样简单。