我在记事本中有一些数据很乱。在保存不同数据的任何不同列之间基本上没有空格。我知道数据的空间。 例如,第1-2列是X,第7-10列是Y ....
我该如何组织这个?可以在R中完成吗?这样做的最佳方式是什么?
答案 0 :(得分:1)
?read.fwf
可能是一个不错的选择。
设置文件的路径:
temp <- "\pathto\file.txt"
然后在文件中设置变量的宽度,如下所示。
#1-2 = x, 3-10=y
widths <- c(2,8)
然后设置列的名称。
cols <- c("X","Y")
最后,将数据导入会话中的新变量:
dataset <- read.fwf(temp,widths,header=FALSE,col.names=cols)
答案 1 :(得分:0)
我过去为处理那种混乱而做的事实上是将它作为分隔宽度文本导入excel,然后另存为CSV。
给你一个建议。如果这是一个一个项目,那应该没问题。根本没有编码。但如果它是一个重复犯罪者......那么你可能会看一下正则表达式。
即。 ^(。{6})(。{7})(。{2})(。{5})$ 4个字段,宽度分别为6,7,2和5个字符。