将交互式网页内容刮到R?

时间:2018-04-22 11:43:03

标签: r web-scraping rvest

我正在尝试将完整的Trump Twitter Archive抓取到R中的过程自动化。我被卡住了,因为该页面很奇怪(对我来说)动态和静态内容的合并。

之前我使用R来抓取网页的静态内容,并且我已经成功地以老式的方式摄取了这个特定的数据集:

  • 使用“导出”按钮选择json版本;
  • 使用ctrl-C复制搜索窗口中显示的结果;
  • 将该内容粘贴到空的纯文本文件中;
  • 将纯文本文件保存到扩展名为.json的硬盘中;和
  • 使用fromJSON()包中的jsonlite将该本地文件读入R。

有没有办法以编程方式执行此操作,可能使用rvest

0 个答案:

没有答案