使用Google表格通过网络抓取从中提取链接文本

时间:2018-12-16 17:41:25

标签: web-scraping google-sheets

我有以下<html>文字:

<a href="link.html" target="_parent">Text</a>

如何获得“文本”值?我正在尝试使用此方法,但是却得到一个空值:

=INDEX(importxml("http://www.remoteurl.com";"//a[@href='link.html']");1)

2 个答案:

答案 0 :(得分:0)

我尝试使用您的语法,它对我有用。我出于测试目的将其缩短了一点。

=importxml("https://www.remoteurl.com","//a[@href='link.html']")

请确保您在xpath查询中传递的href值正是网页上显示的值,例如如果网页使用相对路径,则还必须使用相同的相对路径。

答案 1 :(得分:0)

我做得很好,但是问题在于编码是在iframe中进行的,因此无法实现。