使用Xpath从html获取href

时间:2012-06-19 18:28:33

标签: xpath google-apps-script

首次发布此处以及Google应用中的新手。我正在为一家公司的电子表格中整理一个网址。例如:http://www.linkedin.com/company/National-Renewable-Energy-Laboratory

我可以使用Google电子表格和Xpath中的= importXML来获取每个公司页面上列出的网站网址。

我已经到了可以从页面中提取所有href的点,我需要的链接就在那里,但我只想要网站网址。

以下是我目前使用的内容:

=importXML(R2, "//*[@href]")

以下是我的电子表格的链接:https://docs.google.com/spreadsheet/ccc?key=0AheVK6uxf6AvdHhILTFrR1k4Wl9tWW5OVWpRRUJKMlE

代码在S2

感谢您的回复。

2 个答案:

答案 0 :(得分:1)

//*[@href]匹配具有href的元素,而不是href属性本身。请改为//@href

答案 1 :(得分:0)

它更复杂,但一个好的解决方案是使用LinkedIn API,您可以使用UrlFetchApp进行访问。