应用错误收集

如何使用Perl查找和清除字符串中的子字符串？

时间：2013-02-18 14:51:16

标签： html perl

我有一些我需要编辑的HTML文件。我需要在文件中找到一些值并清理它。

例如我有html文件：

    .
    .
    Diagnostics
      align="right"
      align="right"
      align="right"
      align="right"
      align="right"
      align="right"
      align="right"

    Configuration
      align="right"
      align="right"
      align="right"
      align="right"
      align="right"
      align="right"
      align="right"
    .
    .

我需要找到并清理

    Diagnostics
      align="right"
      align="right"
      align="right"
      align="right"
      align="right"
      align="right"
      align="right"

来自我的HTML文件。

这是一种简单而快捷的方法吗？

感谢。

1 个答案:

答案 0 :(得分：2)

查看一个模块，例如HTML::TreeBuilder，用于解析Perl中的HTML。这不是一个非常简单的任务，但链接的文档有一些例子。如果您遇到麻烦，我建议您尝试并提出具体问题。

另一种方法是使用regular expressions。通常不推荐用于解析HTML - 不可能用正则表达式可靠地解析任意HTML。然而，如果您只想从具有可预测格式的文件中快速删除某种东西，它可能是一个不错的选择。只需确保你的问题在走这条路线之前就像你想象的那样简单。