有没有什么可以将文件中的HTML特殊字符转换为普通字符?

时间:2009-12-01 16:39:30

标签: html character-encoding special-characters

我有一些HTML输出来找我的源代码文件,所以它们很不可用。

我有这样的事情:

%include "macros.mac"

应该是:

%include "macros.mac"

是否有任何脚本(sh,perl,batch,...)将每个文件(大约有200个)转换为相应的字符?字符包括& lt;& gt;,...(我在中间放置一个空格,以便它不会将它们转换为<和>。

谢谢,非常感谢。

2 个答案:

答案 0 :(得分:2)

如果它只是四个&"<>字符,sed(1)可以提供帮助:

sed 's/&quot;/"/g; s/&lt;/</g; s/&gt;/>/g; s/&amp;/\&/g'

更新 :我的原始提案如下,并有一个错误:

sed 's/&amp;/\&/g; s/&quot;/"/g; s/&lt;/</g; s/&gt;/>/g'

这会转换为“&amp; amp; gt;”进入“&gt;”这是错误的。

答案 1 :(得分:0)

您可以尝试使用像Windows grep或textcrawler这样的工具