我是初学R学习者,如果我说一些不连贯的话,请耐心等待。
我有一个大的矢量变量,只包含5000个元素,并且想知道它们是什么,知道有几个重复。 An introduction to R除了基本数据结构之外似乎没有说什么,我也不知道R是否提供内置的此功能。
如果没有这样的"数据结构",是否有一些内置函数可以过滤掉矢量或列表中的重复元素?
答案 0 :(得分:2)
要删除向量中多次出现的值,请使用duplicated()
一个例子是
x <- c(1,2,3,3,4,5,5,6)
x[!duplicated(x)]
# [1] 1 2 3 4 5 6
这将返回x
重复的所有值!
。
这也适用于更复杂的数据结构,如data.frames
。有关详细信息,请参阅?duplicated
。
unique(x)
提供向量中出现的所有值。
table(x)
在向量x
table(x)
# x
# 1 2 3 4 5 6
# 1 1 2 1 2 1
答案 1 :(得分:1)
unique()函数可以正常工作。
唯一(“矢量名称”)
答案 2 :(得分:0)
如果你想要数据结构,R有所谓的&#34;数据框&#34;你可以用它做任何你想做的事情,例如你甚至可以忽略重复的行。您可以使用nameofdataframe <- as.data.frame(data)
将数据转换为数据框,然后使用函数unique(nameofdataframe)
删除重复项