我正在尝试使用腐烂的西红柿中的rvest
提取标题
我使用以下代码:
urlhtml<-read_html("http://www.rottentomatoes.com/browse/opening/")
df<-html_text(html_nodes(urlhtml,xpath="//*[@id='movies-collection']/div/div/div[2]/a"))
xpath
源自谷歌浏览器,所以我认为它是正确的,但是,它会返回空列表...我无法弄清楚出了什么问题。
有人可以帮忙吗? 非常感谢
答案 0 :(得分:0)
谢谢大家,结果就像@RogerLindsjö说的那样,我需要一个javascript来解析html并使用phantomjs来配合R报废