如何在R中拆分不相等的列

时间:2012-03-09 17:08:10

标签: r database-design split tapply

我有一个应该包含14列的数据集,但当我将其读入R时,它呈现为两列,后面的列作为一列读取,并且都以“。”分隔。

我上传时使用:

  

dat< - read.table(“/ data / Ger.female.RAWMACH”,header = F,sep =“\ t”)

下面我提供了输出:

  

head(dat)

V1
特质
CASE
CASE
CASE
CASE
CASE
案例

V2 MARKER .......... ALLELES..FREQ1 .... RSQR ... EFFECT1..OR ...... STDERR..​​WALDCHISQ.PVALUE ..... LRCHISQ.LRPVAL.NCASES。 NCONTROLS
rs7 T A .9104 .0001 -3.944 0.019 19.634 0.0403 0.8408 0.0403 0.8409 260 446

rs6 A C .9114 .0002 -2.552 0.078 14.349 0.0316 0.8589 0.0316 0.8589 260 446

rs9 C T .8444 .0001 2.772 15.985 15.076  0.0338 0.8541 0.0338 0.8542 260 446

rs5 G A .9164 .0001 -3.683 0.025 18.039 0.0417 0.8382 0.0417  0.8383 260 446

rs2 T C .5168 .0001 -2.466 0.085 10.811 0.0520 0.8195 0.0520 0.8196 260 446

rs1 T G .8229 .0002 -1.727 0.178 12.241 0.0199 0.8878 0.0199 0.8878 260 446

我尝试了一些事情(重写表格,colsplit)但没有成功。我错过了什么?

我感谢您的任何建议!

2 个答案:

答案 0 :(得分:1)

您认为自己有一个制表符分隔文件,但事实并非如此。你也有一个标题。只需删除sep="\t"并设置header=TRUE

即可使用默认的空白分隔符

答案 1 :(得分:0)

如果没有更多信息,很难肯定地说,但我非常有信心解决这个问题的最佳方法是首先正确加载表格。除非您正在加载的数据的实际结构是您正在获取的形式,否则您加载错误;查看read.table及相关方法的文档,特别是sepheader参数。我猜这将解决你的数据导入问题,而不需要事后清理。