应用错误收集

如何在R中拆分不相等的列

时间：2012-03-09 17:08:10

标签： r database-design split tapply

我有一个应该包含14列的数据集，但当我将其读入R时，它呈现为两列，后面的列作为一列读取，并且都以“。”分隔。

我上传时使用：

dat＆lt; - read.table（“/ data / Ger.female.RAWMACH”，header = F，sep =“\ t”）

下面我提供了输出：

head（dat）

V1
特质
CASE
CASE
CASE
CASE
CASE
案例

V2 MARKER .......... ALLELES..FREQ1 .... RSQR ... EFFECT1..OR ...... STDERR..WALDCHISQ.PVALUE ..... LRCHISQ.LRPVAL.NCASES。 NCONTROLS
rs7 T A .9104 .0001 -3.944 0.019 19.634 0.0403 0.8408 0.0403 0.8409 260 446

rs6 A C .9114 .0002 -2.552 0.078 14.349 0.0316 0.8589 0.0316 0.8589 260 446

rs9 C T .8444 .0001 2.772 15.985 15.076 0.0338 0.8541 0.0338 0.8542 260 446

rs5 G A .9164 .0001 -3.683 0.025 18.039 0.0417 0.8382 0.0417 0.8383 260 446

rs2 T C .5168 .0001 -2.466 0.085 10.811 0.0520 0.8195 0.0520 0.8196 260 446

rs1 T G .8229 .0002 -1.727 0.178 12.241 0.0199 0.8878 0.0199 0.8878 260 446

我尝试了一些事情（重写表格，colsplit）但没有成功。我错过了什么？

我感谢您的任何建议！

2 个答案:

答案 0 :(得分：1)

您认为自己有一个制表符分隔文件，但事实并非如此。你也有一个标题。只需删除sep="\t"并设置header=TRUE。

即可使用默认的空白分隔符

答案 1 :(得分：0)

如果没有更多信息，很难肯定地说，但我非常有信心解决这个问题的最佳方法是首先正确加载表格。除非您正在加载的数据的实际结构是您正在获取的形式，否则您加载错误;查看read.table及相关方法的文档，特别是sep和header参数。我猜这将解决你的数据导入问题，而不需要事后清理。