我正在处理的某些数据帧出现一个奇怪的错误,将我所有的行移动了一个单元格,因此它们不再与我的数据相对应:
而不是这样:
> head(xaa.small)
AGCATTCGAAACATCGAGGCTAACATCCAGTACGCAAGTGGCC AGCATTCGAAACATCGCCAGTTCAATCCATCTTCACAGTGGCC
hg19_ENSG00000000003 0 0
hg19_ENSG00000000419 0 0
hg19_ENSG00000000457 0 0
它看起来像这样:
> head (xab.small)
AGCATTCGAAACATCGAGGCTAACATCCAGTACGCAAGTGGCC AGCATTCGAAACATCGCCAGTTCAATCCATCTTCACAGTGGCC
0 0
hg19_ENSG00000103160 0 0
hg19_ENSG00000103168 0 0
某些数据框上有空白。
如何删除它并“修复” R中的数据帧?还是更有效地导入? fill = True
在导入数据框时有效,但阻止了我进行进一步的分析。
数据来自一个巨大的tsv文件,该文件分为多个部分。也许在剪切过程中出现了错误(使用split
函数是为了将初始tsv文件剪切成几个200 Mb文件)
答案 0 :(得分:0)
我发现了错误:
将初始文件切成几段时,它是按字节而不是按行分割的。因此,有时会在最后一行的最后一列进行剪切或类似这样的操作,从而生成不完整的行或创建空白空间...
我仅使用split -l (number of lines) file
而不是split -b (number of bytes)
来纠正错误