使用JSoup解析Twitter

时间:2014-06-10 03:43:06

标签: android html twitter jsoup user-agent

所以这是我的代码:

    Document doc = Jsoup.connect(urlString)
            .userAgent("Mozilla/5.0 (X11; Linux i686) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.0.1916.114 Safari/537.36")
            .get();

    System.out.println(doc);

所以我正在使用JSoup,并尝试在Android应用上解析Twitter主题标签页面的HTML(供参考,如http://www.twitter.com/hashtag/stackexchange)。但出于某种原因,我无法访问真正的HTML。我得到移动版本或不完整版本。我的userAgent是对的,我敢肯定。

有什么想法?我到处寻找,但输入“Twitter”和“JSoup”或“HTML”通常会显示关于JSoup和HTML的Twitter提要。

1 个答案:

答案 0 :(得分:0)

它对我来说很好,但有些内容是用JS加载的,所以你需要使用另一个库作为Selenium或HTMLUnit来运行javascript

JSoup是一个使用CSS Selectors的HTML Parser