R:提取关键字后的值和行(文本文件挖掘)

时间:2012-12-09 15:24:47

标签: r keyword text-mining

环境: 我有(简单的).csv和.dat文件,它们是从实验室设备和其他存储测量或计算信息的程序创建的。我发现这个用于其他语言,但也没有用于R

问题: 使用R,我试图提取值以快速显示结果,而无需打开创建的文件。我有两个典型的设置:

a)我需要在已知关键词之后读取先验未知值 b)我需要在已知的关键词或行之后读取行

我无法使scan()和grep()等函数工作。

c)最后我想循环一个文件夹中的几十个文件并给我一个摘要(为了使图片完整:我将管理这部分)

我很感激任何形式的帮助。

1 个答案:

答案 0 :(得分:1)

好吧,它适用于键值(虽然可能不是很好)

 variable<-scan("file.csv", what=character(),sep="")

返回所有内容的字符向量

 variable[grep("keyword", ks)+2]     # + 2 as the actual value is stored two places ahead

返回已隐藏值的字符。

 as.numeric(lapply(variable, gsub, patt=",", replace="."))

完成:数据必须更改为数字和“,”和“。”问题需要解决。

排成一行:      data = as.numeric(lapply(ks [grep(“Ks_Boden”,ks)+2],gsub,patt =“,”,replace =“。”))

坚持不懈是一种资产; - )

其余部分尚未完成,但我会在完成后发布。