我正在从网站中的事件列表中提取事件描述。 每个事件都是一个href链接,该链接转到另一个页面,我们可以在其中找到事件的图像和描述。我试图将图像URL和所有事件的描述存储在一个数组中,所以我在循环末尾使用了下面的代码,但是我只获得了循环的图像和最后一个事件的描述:
m<-c(images_of_events)
n<-c( description_of_events)
cc<-remDr$findElement(using = "css", "[class = '_24er']")
cc<-remDr$getPageSource()
page_events<-read_html(cc[[1]][1])
links_events_data=html_nodes(page_events,'._24er > table > tbody > tr > td >
div> div._4dmk > a ')
events_urls<-html_attr(links_events_data,"href")
//每个事件的循环
for (i in events_urls) {
remDr$navigate(paste("localhost://www.mywebsite",i,sep=""))
#get image
imagewebElem <- remDr$findElement(using = "class", "scaledImageFitWidth")
images_of_events<-imagewebElem $getElementAttribute("src")
descriptionwebElem <-remDr$findElement(using = "css", "[class = '_63ew']")
descriptionwebElem <-remDr$getPageSource()
page_event_description<-read_html(descriptionwebElem[[1]][1])
events_desc =html_nodes(page_event_description,'._63ew > span')
description_of_events= html_text(events_desc)
m<-c(images_of_events)
n<-c( description_of_events)
}
答案 0 :(得分:1)
要在R中的数组中保存值,您必须
1)创建array / data.frame dta <- data.frame(m=c(),n=c())
,然后保存到其中dta[i,1] <- image_of_events
和dta[i,2] <- description_of_evants
,其中i
是数字迭代器
2)创建array / data.frame并使用rbind
添加类似dta <- rbind(dta, data.frame(m=images_of_events, n = description_of_events))
的值