使用ImportXML和XPath捕获元素

时间:2017-12-20 14:25:27

标签: html xpath web-scraping google-sheets

我正试图通过Google表格从页面中获取以下信息here

我必须检索这两个用红色圈出的项目,如附带的刮刮数据屏幕截图所示。

screenshot of scrape data interest

我试过这个,但它不起作用(在A1中有链接,B1是公式):

=IMPORTXML(A1;"/html/body/div[1]/div[2]/div[1]/span[1])

=IMPORTXML(A1;"/html/body/div[1]/div[3]/table/tbody/tr[1]/td[3])

有没有人可以帮助我?

1 个答案:

答案 0 :(得分:0)

他们的robots.txt文件:

User-Agent: *  
Disallow: /

The "User-agent: *" means this section applies to all robots. The "Disallow: /" tells the robot that it should not visit any pages on the site.

所需信息可以使用Excel从Web提取。