我文件中的一个列是url编码的,我必须解码该列,并且需要根据列内的值执行一些操作。有什么方法可以在awk中解码该列吗?
答案 0 :(得分:5)
你必须根据你的文件格式进行调整,但基本原则在这里(用GNU Awk 3.1.7测试):
sh$ echo 'Hello%2C%20world%20%21' | awk '
{
for (i = 0x20; i < 0x40; ++i) {
repl = sprintf("%c", i);
if ((repl == "&") || (repl == "\\"))
repl = "\\" repl;
gsub(sprintf("%%%02X", i), repl);
gsub(sprintf("%%%02x", i), repl);
}
print
}
'
Hello, world !
如果你有gawk
,你可以将它包装在一个函数中(归功于brendanh in a comment below):
function urlDecode(url) {
for (i = 0x20; i < 0x40; ++i) {
repl = sprintf("%c", i);
if ((repl == "&") || (repl == "\\")) {
repl = "\\" repl;
}
url = gensub(sprintf("%%%02X", i), repl, "g", url);
url = gensub(sprintf("%%%02x", i), repl, "g", url);
}
return url;
}