所以这是我的代码:
Document doc = Jsoup.connect(urlString)
.userAgent("Mozilla/5.0 (X11; Linux i686) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.0.1916.114 Safari/537.36")
.get();
System.out.println(doc);
所以我正在使用JSoup,并尝试在Android应用上解析Twitter主题标签页面的HTML(供参考,如http://www.twitter.com/hashtag/stackexchange)。但出于某种原因,我无法访问真正的HTML。我得到移动版本或不完整版本。我的userAgent是对的,我敢肯定。
有什么想法?我到处寻找,但输入“Twitter”和“JSoup”或“HTML”通常会显示关于JSoup和HTML的Twitter提要。
答案 0 :(得分:0)
它对我来说很好,但有些内容是用JS加载的,所以你需要使用另一个库作为Selenium或HTMLUnit来运行javascript
JSoup是一个使用CSS Selectors的HTML Parser