我有一个应该包含14列的数据集,但当我将其读入R时,它呈现为两列,后面的列作为一列读取,并且都以“。”分隔。
我上传时使用:
dat< - read.table(“/ data / Ger.female.RAWMACH”,header = F,sep =“\ t”)
下面我提供了输出:
head(dat)
V1
特质
CASE
CASE
CASE
CASE
CASE
案例
V2
MARKER .......... ALLELES..FREQ1 .... RSQR ... EFFECT1..OR ...... STDERR..WALDCHISQ.PVALUE ..... LRCHISQ.LRPVAL.NCASES。 NCONTROLS
rs7 T A .9104 .0001 -3.944 0.019 19.634 0.0403 0.8408 0.0403 0.8409 260 446
rs6 A C .9114 .0002 -2.552 0.078 14.349 0.0316 0.8589 0.0316 0.8589 260 446
rs9 C T .8444 .0001 2.772 15.985 15.076 0.0338 0.8541 0.0338 0.8542 260 446
rs5 G A .9164 .0001 -3.683 0.025 18.039 0.0417 0.8382 0.0417 0.8383 260 446
rs2 T C .5168 .0001 -2.466 0.085 10.811 0.0520 0.8195 0.0520 0.8196 260 446
rs1 T G .8229 .0002 -1.727 0.178 12.241 0.0199 0.8878 0.0199 0.8878 260 446
我尝试了一些事情(重写表格,colsplit)但没有成功。我错过了什么?
我感谢您的任何建议!
答案 0 :(得分:1)
您认为自己有一个制表符分隔文件,但事实并非如此。你也有一个标题。只需删除sep="\t"
并设置header=TRUE
。
答案 1 :(得分:0)
如果没有更多信息,很难肯定地说,但我非常有信心解决这个问题的最佳方法是首先正确加载表格。除非您正在加载的数据的实际结构是您正在获取的形式,否则您加载错误;查看read.table
及相关方法的文档,特别是sep
和header
参数。我猜这将解决你的数据导入问题,而不需要事后清理。