Question

我试图从R中的表上的列表中收集URL。但是表格是网页中的html元素，因此xpath没有充分发挥作用。我得到以下结果：

> doc<-read_html(url("http://www.bibliotecanacional.gov.co/rnbp/directorio-de-bibliotecas-publicas"))
> v<-toString(xml_find_all(doc, xpath='//*[@id="ContentPlaceHolder1_Ejemplo2_GridviewConCSSFriendly1_GridViewJedis_LinkButton1_0"]'))
> v
[1] ""

在图像中，您可以看到我如何通过检查url元素来提取xpath。

Extraction of xpath

我将非常感谢你的帮助。感谢。

Answer 1

该页面包含iframe。因此，您需要先切换到iframe，然后才能从该iframe获取该元素。

它有一个标题为iframe：Libros digitales y aplicaciones producidas BNC

不确定如何使用您正在使用的内容，但您可以在此处轻松查看。

将一个html元素刮到另一个

1 个答案: