我正在用R抓一个网页。我使用“RSelenium”和“XML”包。下表在某些行中有一个单选按钮。我需要知道哪些行(例如第一行和第三行)禁用了单选按钮,以便在抓取期间跳过该行。哪种方法最好?我无法弄清楚如何轻松获取具有禁用输入的行数。
<table cellspacing="1" cellpadding="0" border="0" width="100%" id="table1">
<tbody><tr>
<td width="36"> </td>
<td width="100"><b>Matricola Inps</b></td>
<td width="150"><b>Denominazione</b></td>
<td width="100"><b>Stato Adesione</b></td>
<td width="120"><b>Note</b></td>
</tr>
<tr>
<td align="center" width="36">
<input type="radio" disabled="" id="sistema" name="unitaId" value="XXX">
</td>
<td><font color="#C0C0C0">
N/D
</font>
</td>
<td>
<font color="#C0C0C0">
blablabla
</font>
</td>
<td>
<font color="#C0C0C0">
</font>
</td>
<td>
</td>
</tr>
<tr>
<td align="center" width="36">
<input type="radio" id="sistema" name="unitaId" value="XXX">
</td>
<td>
N/D
</td>
<td>
blablabla
</td>
<td>
</td>
<td>
</td>
</tr>
<tr>
<td align="center" width="36">
<input type="radio" id="registra" name="unitaId" value="XXXX">
</td>
<td>
XXXXX
</td>
<td>
blabla
</td>
<td>
Aderente
</td>
<td>
Sede Principale
Sede Legale
</td>
</tr>
</tbody></table>
非常感谢。
答案 0 :(得分:0)
我找到了以下解决方案。
nodesToString <- xpathSApply(doc, "//tr", saveXML)
disabledIndexes <- which(grepl('disabled', nodesToString))
将来可能对某人有用......