我正在尝试以下方法来提取页面的一部分,同时忽略其中一个嵌套字段" rating"。以下语法在提取我需要的内容方面都不成功。有什么建议吗?
raw <- read_html(res[[1]]) %>%
html_nodes(xpath = '(//div[@class="results" and not(div[contains(@class, "span4 mobile-span1 ratings")])]')
raw <- read_html(res[[1]]) %>%
html_nodes(xpath = '(//div[not(contains(@class, "span4 .mobile-span1 .ratings"))]//div[@class="results"])')