使用xpath查找表中的空单元格

时间:2014-12-05 16:18:31

标签: python xpath

我有一些看起来像这样的HTML代码:

<td class="Label">France</td>
<td class="Label">French</td>
<td class="Label"><img src="frenchflag.jpg></td>
<td class="Label">Germany</td>
<td class="Label"></td>
<td class="Label"><img src="germanflag.jpg></td>

我用python&amp; amp; webscraping selenium和我想要一个如下所示的列表:

['France','French','Germany','N/A']

所以我不能使用班级名称来识别这些,因为他们都是一样的。我也不能使用

 if element.text() is None:
mylist.append('N/A')

因为这样也会仅仅使用图像中的图像来拉入标记,我需要忽略它。

xpath没有.contents()或类似内容吗?

谢谢!

1 个答案:

答案 0 :(得分:0)

此xpath将拒绝具有子元素的项目。然后,您可以扫描列表,将N / A添加到没有文本元素的结果中。

td[@class="Label"][not(*)]