首次发布此处以及Google应用中的新手。我正在为一家公司的电子表格中整理一个网址。例如:http://www.linkedin.com/company/National-Renewable-Energy-Laboratory
我可以使用Google电子表格和Xpath中的= importXML来获取每个公司页面上列出的网站网址。
我已经到了可以从页面中提取所有href的点,我需要的链接就在那里,但我只想要网站网址。
以下是我目前使用的内容:
=importXML(R2, "//*[@href]")
以下是我的电子表格的链接:https://docs.google.com/spreadsheet/ccc?key=0AheVK6uxf6AvdHhILTFrR1k4Wl9tWW5OVWpRRUJKMlE
代码在S2
感谢您的回复。
答案 0 :(得分:1)
//*[@href]
匹配具有href的元素,而不是href属性本身。请改为//@href
。
答案 1 :(得分:0)
它更复杂,但一个好的解决方案是使用LinkedIn API,您可以使用UrlFetchApp进行访问。