在ubuntu 14.04中未解析URL

时间:2015-11-27 09:40:52

标签: java ubuntu ubuntu-14.04 webclient htmlunit

我在我的Ubuntu或Runnable JAR中运行了一个cron作业计划。

我的字符串网址收到了一个例外,但在我的Windows开发中,它没问题。它无法解析正确的string url,请在下面查看

java.io.FileNotFoundException: http://www.carlolotti.com/enoteca-vini-valdostani/chardonnay-elevé-en-fut-de-chene-anselmet-2007-6s0jwecq.asp

这是源代码:

            HttpURLConnection conn; 
        URL obj = new URL(url);
        conn = (HttpURLConnection) obj.openConnection();

        // default is GET
        conn.setRequestMethod("GET");
        conn.setUseCaches(true);

        // act like a browser
        conn.setRequestProperty("User-Agent", USER_AGENT);
        conn.setRequestProperty("Accept",
            "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8");

        int responseCode = conn.getResponseCode();

        if(debug)
            System.out.println("\nSending 'GET' request to URL : " + url);
        if(debug)
            System.out.println("Response Code : " + responseCode);
        try{
            BufferedReader in = 
                    new BufferedReader(new InputStreamReader(conn.getInputStream() , "UTF-8"));
            String inputLine;
            StringBuffer response = new StringBuffer();
            while ((inputLine = in.readLine()) != null) {
                //inputLine=StringEscapeUtils.escapeHtml3(inputLine);
                //if(inputLine.contains("Albari"))
                //  t=1;
                response.append(inputLine);
                if(csv)
                    response.append(lineRet);
            }
            in.close();

            return response;
        }catch(Exception e){
            e.printStackTrace();
        }

        return null;

我怀疑我的语言环境中的Ubuntu的语言LANG=en_GB.UTF-8我是否需要将其更改为en_US.UTF-8?我不太确定,但这是我的第一次调查。

1 个答案:

答案 0 :(得分:0)

您必须使用é替换网址中的é