我使用Jsoup连接到一个URL并从该URL获取HTML,我想检测HTML响应的用户代理。 如果您知道的话,请教我!
答案 0 :(得分:0)
要确定要连接的Web服务器是否根据用户代理响应不同的HTML内容,除了反复试验,我看不到其他方法。
以下是在JSoup中设置用户代理的方法:
Response response= Jsoup.connect(location)
.ignoreContentType(true)
.userAgent("Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36")
.referrer("http://www.google.com")
.timeout(10000)
.followRedirects(true)
.execute();
Document doc = response.parse();
我还为请求添加了其他一些有用的修改,例如设置引荐来源网址,超时等。有关这些方法的详细信息,请查看Jsoup文档:https://jsoup.org/apidocs/org/jsoup/Connection.html
如果您想尝试我们不同的用户代理字符串,我建议您在野外查找。可以在这里找到一个集合:http://www.useragentstring.com/pages/useragentstring.php