如果缺少行“表示不同的行数”,则RVest数据帧将中断

时间:2019-04-30 23:06:31

标签: html r

使用rvest抓取一些亚马逊畅销书列表;在页面上的某些产品上,有些不包含评论或评分(请参见附件图片)https://imgur.com/a/72Qb6JU

这会破坏数据帧并返回“参数暗示不同的行数”。

在具有完整列表的页面上实现我想要的效果非常好。尝试查看其他人也遇到了同样的错误,并且不确定从哪里开始(对此还是很新的东西)

reviews_data_html <- html_nodes(webpage,'.a-size-small.a-link-normal')
reviews_data <- html_text(reviews_data_html)
reviews_data <- gsub(",","",reviews_data)
reviews_data <- as.numeric(reviews_data)
head(reviews_data)

bestsellers_df<-data.frame(Rank = rank_data, Stars = stars_data, 
                      Reviews = reviews_data, Price = price_data)

str(bestsellers_df)

仅需剪一下,即可获得结构外观。价格,评级和等级还有其他节点,具有相同的布局。

我是否有办法将缺失的项作为N / A填充到数据框中?

0 个答案:

没有答案