长话短说;我正在建立一个大约在1995年制作的网站,所以这些都是桌子;没有ID或类名的表,它们无处不在。
我需要从特定的单元格中获取一些文本,并且在使用JQuery
进行一些游戏之后,我已经设法构建了它的Parents()
元素层次结构,我想知道现在,如果我可以根据此信息使用JSoup
从表格单元格中提取文本。
例如,我想要来自<td>
的一些文字来自这些父母:
Parent[0]: [object HTMLTableCellElement] //Actually cell containing text
Parent[1]: [object HTMLTableRowElement] //Row of that cell
Parent[2]: [object HTMLTableSectionElement] //etc..
Parent[3]: [object HTMLTableElement]
Parent[4]: [object HTMLTableCellElement]
Parent[5]: [object HTMLTableRowElement]
Parent[6]: [object HTMLTableSectionElement]
Parent[7]: [object HTMLTableElement]
Parent[8]: [object HTMLDivElement]
Parent[9]: [object HTMLBodyElement]
Parent[10]: [object HTMLHtmlElement]
大约有200页这样的结构,所以我希望使用JSoup
来提取文本,而不需要太多的手工工作。
非常感谢任何意见或建议。
由于