使用rvest抓取一些亚马逊畅销书列表;在页面上的某些产品上,有些不包含评论或评分(请参见附件图片)https://imgur.com/a/72Qb6JU
这会破坏数据帧并返回“参数暗示不同的行数”。
在具有完整列表的页面上实现我想要的效果非常好。尝试查看其他人也遇到了同样的错误,并且不确定从哪里开始(对此还是很新的东西)
reviews_data_html <- html_nodes(webpage,'.a-size-small.a-link-normal')
reviews_data <- html_text(reviews_data_html)
reviews_data <- gsub(",","",reviews_data)
reviews_data <- as.numeric(reviews_data)
head(reviews_data)
bestsellers_df<-data.frame(Rank = rank_data, Stars = stars_data,
Reviews = reviews_data, Price = price_data)
str(bestsellers_df)
仅需剪一下,即可获得结构外观。价格,评级和等级还有其他节点,具有相同的布局。
我是否有办法将缺失的项作为N / A填充到数据框中?