应用错误收集

将交互式网页内容刮到R？

时间：2018-04-22 11:43:03

标签： r web-scraping rvest

我正在尝试将完整的Trump Twitter Archive抓取到R中的过程自动化。我被卡住了，因为该页面很奇怪（对我来说）动态和静态内容的合并。

之前我使用R来抓取网页的静态内容，并且我已经成功地以老式的方式摄取了这个特定的数据集：

使用“导出”按钮选择json版本;
使用ctrl-C复制搜索窗口中显示的结果;
将该内容粘贴到空的纯文本文件中;
将纯文本文件保存到扩展名为.json的硬盘中;和
使用fromJSON()包中的jsonlite将该本地文件读入R。

有没有办法以编程方式执行此操作，可能使用rvest？

0 个答案:

没有答案