我正在编写一个程序进入网页,查找并下载所有图像和常用文档(.docx .pdf等),然后访问页面上的每个链接并执行相同操作。我遇到的问题是当我深入解析链接时,我使用jsoup得到了400个错误:
Exception in thread "main" org.jsoup.HttpStatusException: HTTP error fetching URL. Status=400, URL=http://www.somerandomurl.com
代码:
Document doc = Jsoup.connect(urlstring).userAgent("Chrome").get();
帮助?
答案 0 :(得分:0)
你如何解析链接(请更多代码)?通常需要使用绝对链接而不是简单属性。
答案 1 :(得分:0)
这可能是您的网址中可能包含重音符或特殊字符的问题。