拉表数据

时间:2016-03-12 14:54:35

标签: javascript jquery html

我正在尝试从大型网页中提取字符串。当我转到表数据并复制XPath时,我得到以下内容:

//*[@id="mainForm"]/table[2]/tbody/tr[2]/td[6]/a/text()

我想使用这样的东西:

var table = document.getElementById('table_a');
var cell = table.rows[0].cells[0];
cell

我遇到的麻烦是多个表都缺少标识符(id,class等)。每个<tr>共享同一类packageLine(有500到1500之间)并且没有其他标识符。每个<td>共享同一类normal(每行8个),并且没有其他标识符

我在Stackoverflow网站上发现了这个,但我不知道如何在这种情况下应用它并且我不熟悉jQuery。

$('table:first').children('tbody').children('tr').children('td.hello') 

提前感谢您的帮助。

1 个答案:

答案 0 :(得分:0)

试试这个:https://jsfiddle.net/042xhcL3/1/

请注意,这使用textContent因此它假设表格单元格中没有html。你必须对此进行调整,但它应该可以帮助你完成任务。