我有一些我需要编辑的HTML文件。 我需要在文件中找到一些值并清理它。
例如我有html文件:
. . Diagnostics align="right" align="right" align="right" align="right" align="right" align="right" align="right" Configuration align="right" align="right" align="right" align="right" align="right" align="right" align="right" . .
我需要找到并清理
Diagnostics align="right" align="right" align="right" align="right" align="right" align="right" align="right"
来自我的HTML文件。
这是一种简单而快捷的方法吗?
感谢。
答案 0 :(得分:2)
查看一个模块,例如HTML::TreeBuilder
,用于解析Perl中的HTML。这不是一个非常简单的任务,但链接的文档有一些例子。如果您遇到麻烦,我建议您尝试并提出具体问题。
另一种方法是使用regular expressions。通常不推荐用于解析HTML - 不可能用正则表达式可靠地解析任意HTML。 然而,如果您只想从具有可预测格式的文件中快速删除某种东西,它可能是一个不错的选择。只需确保你的问题在走这条路线之前就像你想象的那样简单。