使用jsoup解析URL时出现404错误

时间:2013-02-06 06:58:02

标签: java url jsoup

使用Jsoup时出现404错误。呼叫为Document doc = Jsoup.parse(url, 30000),网址字符串为http://www.myland.co.il/%D7%9E%D7%97%D7%A9%D7%91-%D7%94%D7%A9%D7%A7%D7%99%D7%94 并且Chrome在Chrome中显示正常。我得到的错误是java.io.IOException: 404 error loading URL http://www.myland.co.il/vmchk/××ש×-×שק××

有什么想法吗?

3 个答案:

答案 0 :(得分:1)

请勿对网站使用parse() - 方法,而是使用connect()。因此,您可以设置更多连接设置。

final String url = "http://www.myland.co.il/%D7%9E%D7%97%D7%A9%D7%91-%D7%94%D7%A9%D7%A7%D7%99%D7%94";

Document doc = Jsoup.connect(url).get();

然而问题是url-encoding:

Exception in thread "main" org.jsoup.HttpStatusException: HTTP error fetching URL. Status=404, URL=http://www.myland.co.il/vmchk/××ש×-×שק××

即使将网址解码回 utf-8 ,也无法解决此问题。

你有“替代”网址吗?

答案 1 :(得分:1)

尝试decodeURL()

String url = "http://www.myland.co.il/%D7%9E%D7%97%D7%A9%D7%91-%D7%94%D7%A9%D7%A7%D7%99%D7%94";
Document doc = Jsoup.connect(url.decodeURL()).get();

答案 2 :(得分:-1)

请记住添加Jsoup的连接:

malloc()