Jsoup基于父结构获取元素文本

时间:2016-04-17 14:48:43

标签: javascript jquery html jsoup html-table

长话短说;我正在建立一个大约在1995年制作的网站,所以这些都是桌子;没有ID或类名的表,它们无处不在。

我需要从特定的单元格中获取一些文本,并且在使用JQuery进行一些游戏之后,我已经设法构建了它的Parents()元素层次结构,我想知道现在,如果我可以根据此信息使用JSoup从表格单元格中提取文本。

例如,我想要来自<td>的一些文字来自这些父母:

Parent[0]: [object HTMLTableCellElement] //Actually cell containing text
Parent[1]: [object HTMLTableRowElement] //Row of that cell
Parent[2]: [object HTMLTableSectionElement] //etc..
Parent[3]: [object HTMLTableElement]
Parent[4]: [object HTMLTableCellElement]
Parent[5]: [object HTMLTableRowElement]
Parent[6]: [object HTMLTableSectionElement]
Parent[7]: [object HTMLTableElement]
Parent[8]: [object HTMLDivElement]
Parent[9]: [object HTMLBodyElement]
Parent[10]: [object HTMLHtmlElement]

大约有200页这样的结构,所以我希望使用JSoup来提取文本,而不需要太多的手工工作。

非常感谢任何意见或建议。

由于

0 个答案:

没有答案