从另一个“td”类中的“td”类中删除数据

时间:2012-04-01 14:58:25

标签: xml xpath web-scraping

我有一个类似于我previous的问题。

我附上了HTML的一部分:

<td class="LIGHTGrey">
<table cellpadding="0" cellspacing="0" border="0" width="100%">
<tbody><tr>
<td><font class="CONTENT">1%</font></td>
</tr>
<tr>
<td><font class="CONTENT">*Not applicable to Guaranteed Funds and Class B Units*</font></td>
</tr>
</tbody></table>
</td>

我想在R中使用1%在第四行中提取XML,我写了类似的内容:

 query = '//td[@class="LIGHTGrey"]/tbody/tr/td/font[@class="CONTENT"]/text()'
 temp <- xpathSApply(doc, query, xmlValue)

但是温度回归NULL,我做错了什么?感谢。

1 个答案:

答案 0 :(得分:0)

我认为你错过了table。试试这个:

query = '//td[@class="LIGHTGrey"]/table/tbody/tr/td/font[@class="CONTENT"]/text()'