从GET请求中删除<br/>

时间:2011-01-17 16:51:12

标签: vbscript get batch-file

我正在使用get请求获取一些页面数据,但需要从完成的文件中删除break标记。基本上我正在做的是获取get请求的输出并将其保存到文件中,但它需要删除其中的破坏标记。保存文件后运行批处理或vb脚本以删除标记我很好,但我不知道如何做到这一点。到目前为止,我所看到的唯一解决方案是删除整行。

编辑:这将部署到多个Windows服务器,因此我希望尽可能减少要求。 I.E. Windows默认拥有的命令/软件。

2 个答案:

答案 0 :(得分:0)

如果您对Python不满意,可以使用Beautiful Soup以相当强大的方式删除<br />元素。有关如何从树中删除元素,请参阅here

答案 1 :(得分:0)

除非我误解,否则可以使用vbscript中的replace函数替换break标记(从标记中假设)。例如:

cleanedText = Replace(rawText,"<br/>",""))

有关使用情况的更多信息,请点击此处

http://www.w3schools.com/Vbscript/func_replace.asp

值得一提的是,该函数逐字执行,因此您可能需要运行几次才能获得所有常见的标记标记:

cleanedText = Replace(rawText,"<br/>","")) //no spaces
cleanedText = Replace(cleanedText,"<br />","")) // a space
cleanedText = Replace(cleanedText,"<br>","")) // unterminated