我想使用rvest包在R中刮取HTML表。它有效,但我有一个问题:并非所有行都被删除。对于这个例子,我使用来自Yahoo!的数据金融。以下是我的代码:
library("rvest")
# I use AAPL as an example
# Time period: Jan 1, 2012 - May 14, 2018
url = 'https://finance.yahoo.com/quote/AAPL/history?period1=1325350800&period2=1526230800&interval=1d&filter=history&frequency=1d'
df = url %>%
read_html() %>%
html_nodes("table") %>%
html_table()
df = data.frame(df[[1]])
nrow(df)
当我看到总行数(仅为101(2017年12月20日 - 2018年5月11日))时,问题就出现了。我错过了什么?
谢谢。