我一直在努力让任何XPath技术都能用于octoparse和类似的软件。我现在正在尝试谷歌表格阅读这里的帖子,也无法让它工作。
输入:幻灯片共享演示文稿网址(例如https://www.slideshare.net/carologic/ai-and-machine-learning-demystified-by-carol-smith-at-midwest-ux-2017)
预期输出:Slideshare嵌入网址(在本例中为https://www.slideshare.net/slideshow/embed_code/key/wZudqqTdctjWXA)
我认为这是使用google sheet获取输出的方法:= importxml(A1,“// meta [@ itemprop ='embedURL'] / @ content”)
它对我不起作用(无法获取网址)。使用Octoparse等我只得到一个空白值。
毫无疑问,我在这里愚蠢。任何帮助都会有用。答案 0 :(得分:0)
它不起作用,因为slideshare由LinkedIN拥有,他们付出了很多努力以确保它们不能被删除,包括谷歌表。在它成为可能之前,但我相信他们最终会接受这项工作。