使用谷歌工作表刮掉XPath

时间:2017-12-15 12:57:11

标签: xpath google-sheets scrape

我一直在努力让任何XPath技术都能用于octoparse和类似的软件。我现在正在尝试谷歌表格阅读这里的帖子,也无法让它工作。

输入:幻灯片共享演示文稿网址(例如https://www.slideshare.net/carologic/ai-and-machine-learning-demystified-by-carol-smith-at-midwest-ux-2017

预期输出:Slideshare嵌入网址(在本例中为https://www.slideshare.net/slideshow/embed_code/key/wZudqqTdctjWXA

我认为这是使用google sheet获取输出的方法:= importxml(A1,“// meta [@ itemprop ='embedURL'] / @ content”)

它对我不起作用(无法获取网址)。使用Octoparse等我只得到一个空白值。

毫无疑问,我在这里愚蠢。任何帮助都会有用。

1 个答案:

答案 0 :(得分:0)

它不起作用,因为slideshare由LinkedIN拥有,他们付出了很多努力以确保它们不能被删除,包括谷歌表。在它成为可能之前,但我相信他们最终会接受这项工作。