Question

我有以下文件（缩短版）

GeneSymbol  ENSG00000000003 ENSG00000000003
GSM1100843_032310_270628991_005.2.CEL    3.914867    3.408872
GSM1100843_032310_270628991_005.CEL  3.914867    3.408872    
GSM1100844_032310_270629051_016.CEL  3.880304    3.036225    
GSM1100845_032310_270629071_019.CEL  3.530294    3.040007    
GSM1100846_032310_270629091_009.CEL  3.929253    4.078683    
GSM1100847_032310_296438041_008.CEL  4.025423    3.246378    
GSM1100848_032310_BDP008_049.CEL     3.786376    3.079892    
GSM1100849_032310_BDP020_051.CEL     3.536456    3.063119    
GSM1100850_032310_BDP022_052.CEL     3.357809    2.985093    
GSM1100851_032310_BDP039_053.CEL     3.806282    3.414897

并尝试用

阅读

theDataFrame = read.table(fileName, header = TRUE,sep="\t",row.names=1)

，但得到

duplicate 'row.names' are not allowed

？为什么？ Row.names是*.CEL条目，不是吗？

Answer 1

您的标签分隔符可能不正确。尝试使用theDataFrame = read.table(fileName, header = TRUE,sep="",row.names=1)

的空白分隔符

inputs <- list(
     list()
    ,list()
    ,list()
    )

# prints list
results <- list()
foreach(input = inputs)  %do% {
  results[[length(results)+1]] <- input
}

# does not print list
results <- list()
for (i in 1: 10) {
  results[[length(results)+1]] <- inputs[[i]]
}

我能够用它来阅读你的例子。

Answer 2

由于某种原因，这是矩阵中的一个小故障。我玩了很多，现在可以使用未经改动的文件。

theDataFrame = read.table(fileName, header = TRUE,sep="\t",row.names = 1)

感谢您的帮助。

row.names不重复，但read.table失败并出现重复错误消息

2 个答案: