如何检测HTML响应的用户代理?

时间:2019-05-22 03:29:29

标签: html jsoup response user-agent detect

我使用Jsoup连接到一个URL并从该URL获取HTML,我想检测HTML响应的用户代理。 如果您知道的话,请教我!

1 个答案:

答案 0 :(得分:0)

要确定要连接的Web服务器是否根据用户代理响应不同的HTML内容,除了反复试验,我看不到其他方法。

以下是在JSoup中设置用户代理的方法:

Response response= Jsoup.connect(location)
       .ignoreContentType(true)
       .userAgent("Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36")  
       .referrer("http://www.google.com")   
       .timeout(10000) 
       .followRedirects(true)
       .execute();

Document doc = response.parse();

我还为请求添加了其他一些有用的修改,例如设置引荐来源网址,超时等。有关这些方法的详细信息,请查看Jsoup文档:https://jsoup.org/apidocs/org/jsoup/Connection.html

如果您想尝试我们不同的用户代理字符串,我建议您在野外查找。可以在这里找到一个集合:http://www.useragentstring.com/pages/useragentstring.php