我正在尝试解析以下页面。
Document doc = Jsoup.connect(“http://www.informatik.unitrier.de/~ley/pers/hd/h/Han:Jiawei.html“).get();
我需要提取第一个表的内容,即只有作者姓名及其出版物。但我只需要从1986年到2012年的表格内容。 jsoup中可能的语法是什么?
任何帮助将不胜感激。
答案 0 :(得分:0)
此网站的数据使用 javascript ,因此无法使用jsoup解析它。
我在这个答案中列出了一些替代方案:Trying to parse html hidden by javascript