当我在R中使用rvest包解析网站时,我的用户代理是什么?

时间:2015-07-14 12:24:30

标签: r web-scraping rvest

由于在R中很容易,我使用rvest包来解析HTML以从网站中提取信息。

我想知道在请求期间我的用户代理(如果有的话)是什么,因为用户代理被分配到互联网浏览器或有办法以某种方式设置它?

我在HTML中打开会话和提取信息的代码如下:

library(rvest)
se <- html_session( "http://www.wp.pl" ) %>% 
html_nodes("[data-st-area=Glonews-mozaika] li:nth-child(7) a") %>%
html_attr( name = "href" )

1 个答案:

答案 0 :(得分:3)

我在教程的某处找到了它,它看起来更简单快捷:

uastring <- "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2228.0 Safari/537.36"
session <- html_session("https://www.linkedin.com/job/", user_agent(uastring))