我如何像在其他国家/地区一样解析HTML数据?
我尝试使用代理(代码):
System.setProperty("http.proxyHost", "some proxy");
System.setProperty("http.proxyPort", "some port");
但它无法正常工作。我仍然使用我的国家语言获取数据。
我也尝试过使用VPN,但是当我执行我的程序时(Jsoup解析器)不会下载任何东西。
编辑:
感谢您的时间,明确的答案帮助我解决了问题。我找到了完整的解决方案there。
答案 0 :(得分:0)
这取决于您尝试下载的网站。如果该站点使用IP地理定位,唯一的解决方案是使用适当的代理:https://stackoverflow.com/a/1433296/1608594
如果网站仅使用HTTP标头来确定语言,您可以使用正确的值发送Accept-Language
,Accept-Charset
和Accept-Encoding
标头。
https://en.wikipedia.org/wiki/List_of_HTTP_header_fields#Request_fields