如何使用IMPORTXML从字体样式中抓取数据

时间:2020-09-28 08:24:22

标签: web-scraping google-sheets-formula

我想使用Google表格公式从https://www.gurufocus.com/term/quick_ratio/TSLA/Quick-Ratio/抓取速动比率数据。

所需数据位于此处的字体样式: enter image description here

我的公式是:

=VALUE(REGEXEXTRACT(IMPORTXML("https://www.gurufocus.com/term/quick_ratio/"& A2& "/Quick-Ratio","//*[@id='def_body_detail_height']/font[1]"), ": ([\d.]+)"))

A2 = TSLA

但是它返回一个错误。

提前谢谢!

1 个答案:

答案 0 :(得分:0)

ImportXML函数不会加载页面! 好消息:您可以改用ImportFromWeb。

您需要从G Suite市场安装插件: https://gsuite.google.com/marketplace/app/importfromweb_easy_web_scraping/278587576794 并激活它(从菜单>附件> ImportFromWeb>激活)

然后只需将IMPORTXML替换为IMPORTFROMWEB:

IMPORTFROMWEB("https://www.gurufocus.com/term/quick_ratio/"& A2 & "/Quick-Ratio","//*[@id='def_body_detail_height']/font[1]")

ImportFromWeb也接受正则表达式。您可以这样简化公式:

=IMPORTFROMWEB("https://www.gurufocus.com/term/quick_ratio/"& A2& "/Quick-Ratio","//*[@id='def_body_detail_height']/font[1]", "(?<=:\s).*?(?=\s)")

(我更改了您的正则表达式,使其使用了“:”和下一个空格之间的内容)