从URL中删除十六进制字符

时间:2012-08-09 14:47:29

标签: java url url-encoding

请处理这个微不足道的问题。

我收到了一些像"SOME_DOMAIN?q\x3dnintendo+mathe\x26um\x3d1\x26ie\x3dUTF-8\x26tbm\x3dshop\x26cid\x3d8123694338777545283\x26sa\x3dX\x26ei\x3dL8cjUJmHO8L30gGa1ICgCw\x26ved\x3d0CI4BEIIIMAk"这样的网址,其中包含一些转义字符。

删除这些十六进制字符的最佳方法是什么?我有这个下面的片段,它解决了我现在的问题,但看起来不是一个可靠的解决方案。

    url = url.replace("\\x2F","/");
    url = url.replace("\\x26","&");
    url = url.replace("\\x3d","=");
    url = url.replace("\\x2F","/");
    url = url.replace("\\x2F","/");

我没有遇到过这个问题,但URL之间可能会出现空格。 URLDecoder.decode应该解决我的问题吗?

请提供建议。

由于

1 个答案:

答案 0 :(得分:5)

这有效

   URLDecoder.decode(yourURLString.replace("\\x", "%"), "UTF-8")

在行动中看到这一点:)

public static void main(String[] args) throws UnsupportedEncodingException {
    String s = "SOME_DOMAIN?q\\x3dnintendo+mathe\\x26um\\x3d1\\x26ie\\x3dUTF-8\\x26tbm\\x3dshop\\x26cid\\x3d8123694338777545283\\x26sa\\x3dX\\x26ei\\x3dL8cjUJmHO8L30gGa1ICgCw\\x26ved\\x3d0CI4BEIIIMAk";
    System.out.println(URLDecoder.decode(s.replace("\\x", "%"), "UTF-8"));

}

返回

SOME_DOMAIN?q=nintendo mathe&um=1&ie=UTF-8&tbm=shop&cid=8123694338777545283&sa=X&ei=L8cjUJmHO8L30gGa1ICgCw&ved=0CI4BEIIIMAk

基本上,您需要将\x替换为%并使用以下方法对其进行解码:

 URLDecoder.decode(url, "UTF-8");

见这里

http://docs.oracle.com/javase/1.5.0/docs/api/java/net/URLDecoder.html#decode%28java.lang.String,%20java.lang.String%29