尝试从priseinvestor.com抓取数据

时间:2020-06-21 06:00:15

标签: xpath web-scraping google-sheets google-sheets-formula google-sheets-importxml

我正在尝试使用Google表格导入一些有关股息历史记录的股票数据。

我要获取的数据来自以下页面:https://www.dividendinvestor.com/dividend-quote/

(例如https://www.dividendinvestor.com/dividend-quote/ibmhttps://www.dividendinvestor.com/dividend-quote/msft

在其他站点上,我已经能够结合使用INDEX和IMPORTHTML从表中获取数据。例如,如果我想从finviz.com获得IBM的“ Forward P/E”,我可以这样做:

=index(IMPORTHTML("http://finviz.com/quote.ashx?t=IBM","table", 11),11,10)

那将抢占表11,向下11行,超过10列,以获得我想要的数据。

但是,我似乎找不到从www.dividendinvestor.com/dividend-quote/ibm网站通过IMPORTHTML导入的任何表。

我正在尝试将值导入“连续分红增加”字段的右侧。

在这种情况下,我要实现的输出是“ 19年”。

我也尝试了IMPORTXML,但是我尝试使用XPATH (using this path: "/html/body/div[3]/div/div/div[2]/div/div/div[2]/div[2]/div[2]/span[20]" )进行的所有操作也都失败了。

有什么帮助吗?理想的最终结果是,我将通过添加一个不同的股票代号来动态构建股息投资人.com URL,并得出其股息支付连续增加多少年的结果。

2 个答案:

答案 0 :(得分:1)

尝试:

=INDEX(IMPORTXML("https://www.dividendinvestor.com/dividend-quote/ibm/", 
 "//span[@class = 'data']"), 9, 1)

enter image description here

答案 1 :(得分:1)

@ player0提出的不错的解决方案。如果您不想使用INDEX,则可以使用:

=IMPORTXML("https://www.dividendinvestor.com/dividend-quote/"&B3,"//a[.='Consecutive Dividend Increases']/following::span[1]")

Const