我已经发布了我们正在使用的代码,这是一个非常快速的运行。我应该弄明白这个问题。
2011年数据集中发生了多少事件?
没有时间戳记具有该日期,但是lastModified列没有。我试图使用此代码返回1如果2011年和0如果没有,但他们都返回0。请帮忙!
theData$year2011 <- ifelse(theData$lastModified == "2011*", 1,0)
这是不起作用的代码。以下是设置数据的代码
require(rjson)
require(plyr)
dataPath <- "http://getglue-data.s3.amazonaws.com/getglue_sample.tar.gz"
theCon<-gzcon(url(dataPath))
n.rows <- 1000
theLines <-readLines(theCon, n=n.rows)
str(theLines)
theLines[1]
theRead<-lapply(theLines[-1],fromJSON)
theData<-ldply(theRead,as.data.frame)
View(theData)
答案 0 :(得分:0)
theData$year2011 <- ifelse(grepl('^2011.*', theData$lastModified), 1,0)