组织凌乱的记事本数据

时间:2012-07-20 00:15:06

标签: r sorting text-files notepad

我在记事本中有一些数据很乱。在保存不同数据的任何不同列之间基本上没有空格。我知道数据的空间。 例如,第1-2列是X,第7-10列是Y ....

我该如何组织这个?可以在R中完成吗?这样做的最佳方式是什么?

2 个答案:

答案 0 :(得分:1)

对于这种情况,

?read.fwf可能是一个不错的选择。

设置文件的路径:

temp <- "\pathto\file.txt"

然后在文件中设置变量的宽度,如下所示。

#1-2 = x, 3-10=y
widths <- c(2,8)

然后设置列的名称。

cols <- c("X","Y")

最后,将数据导入会话中的新变量:

dataset <- read.fwf(temp,widths,header=FALSE,col.names=cols)

答案 1 :(得分:0)

我过去为处理那种混乱而做的事实上是将它作为分隔宽度文本导入excel,然后另存为CSV。

给你一个建议。如果这是一个一个项目,那应该没问题。根本没有编码。但如果它是一个重复犯罪者......那么你可能会看一下正则表达式。

即。 ^(。{6})(。{7})(。{2})(。{5})$ 4个字段,宽度分别为6,7,2和5个字符。