将一个html元素刮到另一个

时间:2017-01-20 16:12:54

标签: html r xpath web-scraping

我试图从R中的表上的列表中收集URL。但是表格是网页中的html元素,因此xpath没有充分发挥作用。我得到以下结果:

> doc<-read_html(url("http://www.bibliotecanacional.gov.co/rnbp/directorio-de-bibliotecas-publicas"))
> v<-toString(xml_find_all(doc, xpath='//*[@id="ContentPlaceHolder1_Ejemplo2_GridviewConCSSFriendly1_GridViewJedis_LinkButton1_0"]'))
> v
[1] ""

在图像中,您可以看到我如何通过检查url元素来提取xpath。

Extraction of xpath

我将非常感谢你的帮助。感谢。

1 个答案:

答案 0 :(得分:0)

该页面包含iframe。因此,您需要先切换到iframe,然后才能从该iframe获取该元素。

它有一个标题为iframe:Libros digitales y aplicaciones producidas BNC

不确定如何使用您正在使用的内容,但您可以在此处轻松查看。