使用IMPORTXML从网页中抓取内容

时间:2018-01-30 08:34:03

标签: google-sheets spreadsheet

我正在尝试使用IMPORTXML将来自Linkedin的工作信息提取到Google表格中。我有一个工作网址列表,我希望从页面(工作标题,说明,公司资料链接等)中将各种元素提取到电子表格中。无论我尝试什么,我都无法得到任何东西。

据我所知,下面的公式看起来正确,但它返回“无法获取网址”错误

=IMPORTXML("www.linkedin.com/jobs/view/585970109","//*[@id='job-details'])")

我非常感谢任何关于我做错事的想法。

由于

1 个答案:

答案 0 :(得分:0)

我会给小费可以帮助你。在IMPORTHTML()内置函数里面它使用urlFetching所以它得到的页面结果没有编译JavaScript,因为它只是Http请求编译JavaScript的人是浏览器。如果你进入Linkedin网站设置并禁用JavaScript并重新加载,页面中的数据就不会出现,并且大多数网站会这样做以保护他们的数据免受此类攻击。