使用grep从R中的txt文件中提取数据

时间:2015-02-25 19:49:11

标签: r

对于一个班级,我必须为每个车型年份的汽车类型找到一堆不同的价格。我们被告知只需使用cars.com,并在缩小搜索范围后将所有文本复制并粘贴到记事本txt文件中。然后保存并使用:

grep' \ $' tmpHondaCRV2012.txt> hondaCRV2012.txt

我不是程序员,所以我真的不知道这意味着什么,但我知道至少要正确保存我的文件并在右边键入所有文件,但它一直给我错误消息" ' \ $'是一个无法识别的字符串开始转义"' \ $"" ......我不知道这意味着什么。有什么建议吗?

1 个答案:

答案 0 :(得分:1)

此grep命令将在Linux上的终端中输入,而不是在R控制台中输入。

但是,如果您使用的是Linux,则可以通过这种方式进入R控制台:

system("grep '\\$' tmpHondaCRV2012.txt > hondaCRV2012.txt")

如果您想直接从网上获取值:

install.packages('XML')
library(XML)
html.raw<-htmlTreeParse(
  'http://www.cars.com/for-sale/searchresults.action?dlId=&dgId=&AmbMkNm=Honda&AmbMdNm=Civic&AmbMkId=20017&AmbMdId=20823&searchSource=ADVANCED_SEARCH&rd=100000&zc=02747&uncpo=2&cpo=&stkTyp=U&VType=&mkId=20017&mdId=20823&alMkId=20017&prMn=&prMx=&clrId=&yrMn=1997&yrMx=1997&drvTrnId=&mlgMn=&mlgMx=&transTypeId=&kw=&kwm=ANY&ldId=&rpp=100&slrTypeId=',
  useInternalNodes=T
)
html.parse<-xpathApply(html.raw, "//span[@class='priceSort']", xmlValue)
values <- unlist(html.parse)