如何读取R中用#分隔的非结构化数据

时间:2014-09-18 16:09:39

标签: r

只是一个简短的问题......任何人都可以帮助我如何阅读R中的以下文本文件。

如果#(分隔符)彼此相邻......则意味着缺少值...

任何想法?还是提示?谢谢你的善意

  

20040215#680# - #6 7.6#1457#-7.3#735#1.2#340.3#13.6#1427#0#0 ## - 7.3#735#7.6#1457 ## =   98829个
  18#680#0.4#11.1#1541#-7.3#635#0.9#130.1#6.6#1137#0#0 ## - 7.3#635#11.1#1541 ## =   98834个
  20040221#680 ########## 7#2#1600#1.7#559#7.3#1604 ## = 98835
  20040222#680 ########## 1 ##### 6.8#1108 ## = 98836
  20040223#680 ########## 0#0 #### 6.8#1602 ## = 98837

1 个答案:

答案 0 :(得分:6)

这似乎做了一个相当简洁的工作 - 只是告诉read.table分离哈希,而不是使用哈希作为注释(否则会把一些东西作为评论丢失):

> read.table("hash.hsv",sep="#", comment="")
        V1  V2   V3   V4   V5   V6  V7  V8    V9  V10  V11 V12 V13  V14  V15
1 20040215 680 -0.6  7.6 1457 -7.3 735 1.2 340.3 13.6 1427   0   0   NA -7.3
2       18 680  0.4 11.1 1541 -7.3 635 0.9 130.1  6.6 1137   0   0   NA -7.3
3 20040221 680   NA   NA   NA   NA  NA  NA    NA   NA   NA   7   2 1600  1.7
4 20040222 680   NA   NA   NA   NA  NA  NA    NA   NA   NA   1  NA   NA   NA
5 20040223 680   NA   NA   NA   NA  NA  NA    NA   NA   NA   0   0   NA   NA
  V16  V17  V18 V19     V20
1 735  7.6 1457  NA = 98829
2 635 11.1 1541  NA = 98834
3 559  7.3 1604  NA = 98835
4  NA  6.8 1108  NA = 98836
5  NA  6.8 1602  NA = 98837