您好,R狂热分子...
一段时间以来,我一直在使用R来抓取来自各种网站的数据,但是这个问题让我很困惑。
我正在尝试从下表中抓取数据: http://www.vigimeteo.com/PREV/obs/obs_seul.html?a=07005&b=
但是到目前为止我的努力失败了。
我尝试了以下
getURL和readHTMLTable的组合
thisURL = http://www.vigimeteo.com/PREV/obs/obs_seul.html?a=07005&b=
theURL = getURL(thisURL,.opts = list(ssl.verifypeer = FALSE) )
tables = readHTMLTable(theURL)
这将导致一个空表
它可能显示为R's Selenium package could have a potential solution,但是由于不熟悉,我还没有弄清楚如何在这里使用它
我感觉我只是在这里缺少一个重要的部分……也许是由于我对JS和XML缺乏了解?
更新:
我注意到,如果我右键单击table元素并使用Chrome的“检查”,它会生成HTML,其中包含表中的所有值,并且非常容易抓取……我仍然没有确保如何在R中达到这一点。任何人都可以在“检查”屏幕上找到提示,以尝试指导我的进度?