使用jsoup从表中提取内容

时间:2013-03-22 14:05:54

标签: java jsoup

我正在尝试解析以下页面。

Document doc = Jsoup.connect(“http://www.informatik.unitrier.de/~ley/pers/hd/h/Han:Jiawei.html“).get();

我需要提取第一个表的内容,即只有作者姓名及其出版物。但我只需要从1986年到2012年的表格内容。 jsoup中可能的语法是什么?

任何帮助将不胜感激。

1 个答案:

答案 0 :(得分:0)

此网站的数据使用 javascript ,因此无法使用jsoup解析它。

我在这个答案中列出了一些替代方案:Trying to parse html hidden by javascript