我正在通过一个私人 Covid 项目深入研究 R: http://members.chello.at/charmingquark/Covid19_Report_v2.1.html
现在我尝试使用从该网站上用 rvest
刮取的一些数字来扩展收集到的信息:
https://info.gesundheitsministerium.gv.at/
第一步,我想将数字显示为文本,然后在地图上的数字上显示: numbers - info.gesundheitsministerium.gv.at/
我浏览了一些教程并测试了一个视图,一切都解决了,但在这种情况下,我只是返回零...
cov_impf_db_url <- read_html("https://info.gesundheitsministerium.gv.at/")
cov_impf_db_url %>%
html_nodes(".text-5xl.tabular-nums") %>%
html_text()
结果
[1] "0" "0" "0"
如果我只是使用
cov_impf_db_url %>%
html_nodes(".text-5xl.tabular-nums")
我明白
{xml_nodeset (3)}
[1] <p class="text-5xl tabular-nums" id="Vaccinations">0</p>
[2] <p class="text-5xl tabular-nums" id="estimatedVaccinations">0</p>
[3] <p class="text-5xl tabular-nums" id="deliveredVaccinations">0</p>
拟合以前的输出,但当我查看网站时,有一个不是“0”的值,例如:
<p class="text-5xl tabular-nums" id="Vaccinations">63.280</p>
我刚开始使用 rvest,从来没有使用过 html,所以我有点迷茫,感谢任何提示。
谢谢,
c|q
刚刚通过这篇文章找到了一个替代方案: rvest web scraping with javascript
后台有 2 个 csv 文件: https://info.gesundheitsministerium.gv.at/data/laender.csv https://info.gesundheitsministerium.gv.at/data/national.csv
我将使用这些,但仍然对原始问题的解决方案感兴趣...... 谢谢