我试图在这里避免使用for循环。我有一个看起来像这样的数据框
sample1,[species 1],[species 2],[species 1]
sample2,[species 3],[species 2],[species 4]
sample3,[species 6],[species 5]
sample3,[species 6],[species 5],[species 7],[species 5]
etc.
每个样本中的列数不相等。我想要计算物种总数。但是,如果物种在不同的样本中,物种只会被视为单独的。例如,物种1仅出现1次,而不是2次。物种5应该出现2次,而不是3次。
以下是我目前拥有1列的代码:
counts <- data.frame(table(str_extract(tolower(df[,column]), "\\[(.*?)\\]")))
希望这是有道理的。如果有任何混淆,我可以编辑问题。 谢谢!