使用 rvest 进行网页抓取,值显示为“0”

时间:2021-01-13 22:59:53

标签: r web-scraping rvest

我正在通过一个私人 Covid 项目深入研究 R: http://members.chello.at/charmingquark/Covid19_Report_v2.1.html

现在我尝试使用从该网站上用 rvest 刮取的一些数字来扩展收集到的信息: https://info.gesundheitsministerium.gv.at/

第一步,我想将数字显示为文本,然后在地图上的数字上显示: numbers - info.gesundheitsministerium.gv.at/

我浏览了一些教程并测试了一个视图,一切都解决了,但在这种情况下,我只是返回零...


cov_impf_db_url <- read_html("https://info.gesundheitsministerium.gv.at/")

cov_impf_db_url %>% 
  html_nodes(".text-5xl.tabular-nums") %>% 
  html_text()

结果

[1] "0" "0" "0"

如果我只是使用

cov_impf_db_url %>% 
  html_nodes(".text-5xl.tabular-nums")

我明白

{xml_nodeset (3)}
[1] <p class="text-5xl tabular-nums" id="Vaccinations">0</p>
[2] <p class="text-5xl tabular-nums" id="estimatedVaccinations">0</p>
[3] <p class="text-5xl tabular-nums" id="deliveredVaccinations">0</p>

拟合以前的输出,但当我查看网站时,有一个不是“0”的值,例如:

<p class="text-5xl tabular-nums" id="Vaccinations">63.280</p>

我刚开始使用 rvest,从来没有使用过 html,所以我有点迷茫,感谢任何提示。 谢谢,
c|q


刚刚通过这篇文章找到了一个替代方案: rvest web scraping with javascript

后台有 2 个 csv 文件: https://info.gesundheitsministerium.gv.at/data/laender.csv https://info.gesundheitsministerium.gv.at/data/national.csv

我将使用这些,但仍然对原始问题的解决方案感兴趣...... 谢谢

0 个答案:

没有答案