批量html文件编辑

时间:2011-09-27 20:52:52

标签: html-editor

我有一千个HTML文件的集合,需要对它们进行一些修剪。我需要删除除<body></body>之外的<div.pg>区域内的所有标签,以使其打印干净。多余的是导航链接,使打印杂乱,使页面占用更多的纸张。内容不一样,所以我找不到并替换代码摘录,但标签是相同的例子,有3个<table>标签要删除,每个标签都有特定的类。操纵批处理HTML文件中的特定标签?

任何批处理技术或软件来完成这项工作? 什么是Windows上的简单解决方案?

2 个答案:

答案 0 :(得分:2)

我会在你拥有的每个html页面上使用xslt转换。批处理不是操纵html文件的工具。您可以使用批处理作为“管理器”将所需文件传递给xsl转换。 Windows还有一个基本的msxml实用程序,您可以下载并安装到您的计算机上:http://www.microsoft.com/download/en/details.aspx?displaylang=en&id=21714

我就是这样做的。我相信还有更多的选择。

答案 1 :(得分:0)

如果是XHTML,您可以使用XSLT将HTML转换为“其他”格式。请在此处查看示例:http://www.w3schools.com/xsl/或此处:http://help.hannonhill.com/discussions/how-do-i/269-strip-specific-html-tag-in-xslt