使用 IMPORTXML 从表单中提取数据

时间:2021-06-04 19:24:33

标签: xml google-sheets xpath google-sheets-formula

我正在尝试使用 IMPORTXML 提取一些内容,但我对 XPATH 的缺乏经验阻碍了我。具体来说,我正在尝试提取出现在 linkfork.co 中的链接预览的图像和描述。例如,https://linkfork.co/preview?url=https%3A%2F%2Ftechcrunch.com%2F2021%2F06%2F03%2Fford-owned-spin-shakes-up-scooter-business-with-new-ceo-e-bikes-and-city-strategy%2F 返回以下内容(我想要红色圆圈中的内容): example

Chrome 的开发工具为图像提供以下 XPATH://*[@id="image-container"]/img

据我所知,这似乎是正确的,但 IMPORTXML 返回错误“导入的内容为空”...

我在公式上尝试了很多变体,只要我尝试从“div class = p-4”下提取内容,所有变体都会返回相同的错误。只是为了确保我没有完全偏离目标,我尝试了以下功能来尝试从页面中提取出我能找到的所有文本:

=IMPORTXML("https://linkfork.co/preview?url=https%3A%2F%2Ftechcrunch.com%2F2021%2F06%2F03%2Fford-owned-spin-shakes-up-scooter-business-with-new-ceo-e-bikes-and-city-strategy%2F","//*[text()]")

它确实从页面中提取了所有文本,除了那个 div 下的文本。我只是在这里猜测,但是否因为该内容在可编辑的表单中?是否可以从中提取数据?任何帮助表示赞赏。

0 个答案:

没有答案
相关问题