删除一个特定的空白单元格,该空白单元格将移动所有行名

时间:2020-02-18 08:57:03

标签: r

我正在处理的某些数据帧出现一个奇怪的错误,将我所有的行移动了一个单元格,因此它们不再与我的数据相对应:

而不是这样:

> head(xaa.small)
                     AGCATTCGAAACATCGAGGCTAACATCCAGTACGCAAGTGGCC AGCATTCGAAACATCGCCAGTTCAATCCATCTTCACAGTGGCC
hg19_ENSG00000000003                                           0                                           0
hg19_ENSG00000000419                                           0                                           0
hg19_ENSG00000000457                                           0                                           0

它看起来像这样:

> head (xab.small)
                     AGCATTCGAAACATCGAGGCTAACATCCAGTACGCAAGTGGCC AGCATTCGAAACATCGCCAGTTCAATCCATCTTCACAGTGGCC
                                                               0                                           0
hg19_ENSG00000103160                                           0                                           0
hg19_ENSG00000103168                                           0                                           0

某些数据框上有空白。

如何删除它并“修复” R中的数据帧?还是更有效地导入? fill = True在导入数据框时有效,但阻止了我进行进一步的分析。

数据来自一个巨大的tsv文件,该文件分为多个部分。也许在剪切过程中出现了错误(使用split函数是为了将初始tsv文件剪切成几个200 Mb文件)

1 个答案:

答案 0 :(得分:0)

我发现了错误:

将初始文件切成几段时,它是按字节而不是按行分割的。因此,有时会在最后一行的最后一列进行剪切或类似这样的操作,从而生成不完整的行或创建空白空间...

我仅使用split -l (number of lines) file而不是split -b (number of bytes)来纠正错误

相关问题