我通过使用chrome的selectorGadget扩展程序在R中进行数据抓取(第一次),它使用包" rvest" this是我正在做的参考
来自this网站,我试图获取数据
这是我的代码
#Specifying the url for desired website to be scrapped
url <- 'http://www.magicbricks.com/property-for-sale/Multistorey-Apartment-real-estate-Mumbai'
#Reading the HTML code from the website
webpage <- read_html(url)
map_data_html <- html_nodes(webpage,'.iconMap .stop-propagation')
map <- html_text(map_data_html)
head(map)
但这只给我文字&#34; map&#34; ,我想访问此地图中的lat和long属性。有什么建议吗?
答案 0 :(得分:3)
可能不是最佳,但这是获得纬度/经度值的一种方法:
map_data_html <- html_nodes(webpage,'.iconMap .stop-propagation')
map = html_attr(map_data_html,"data-link") # get the data-link part
lat = as.numeric(str_match(map, "lat=(.*?)&longt")[,2]) # find the lat
lon = as.numeric(str_match(map, "longt=(.*?)&projectOr")[,2]) # find the lon