我在树形结构中有大约3400个文件(大约80%是html文件)。
样式和旧的东西,如font属性,并添加另一种样式。
<a href="http://www.google.com">as google said</a>
应仅“像谷歌所说”。有没有可以为我做这个的软件? 是否可以制作剧本?
我不知道为此工作的脚本,我认为这可能是快速的方式......任何人都想帮助我吗?
谢谢!
答案 0 :(得分:1)
我设置了一个脚本,打开一个单一的HTML文件,用一个可靠的HTML解析器解析它(BeautifulSoup作为一个很好的例子),然后以两种方式之一遍历它:在SAX模型中,编写代表重写规则或DOM模型目标的函数,将规则编写为XPath查询并对匹配的DOM节点执行操作。
然后只需在所有HTML文件上运行脚本。
答案 1 :(得分:0)
在大多数语言中,通常搜索和替换都很容易。如果你需要它来进行条件解析,你可能需要一个xml / html解析器,或者可能需要学习正则表达式。最好先确保它适用于1个文件;)。